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(57) Abstract: The invention relates to a method for the parallel detection of the degree of methylation of genomic DNA wherein 
the following the steps are performed: (a) chemical treatment at the 5' position of non-methylated cytosine bases converts said bases 
into uracil, thymidine or another base which exhibits hybridization behavior different to that of cytosine in a genomic DNA sample; 
(b) more than ten different fragments, each having less than 2000 base pairs in said chemically treated genomic DNA sample, are 
amplified simultaneously using synthetic oligonucleotides as a primer, whereby said primers each contain genomic sequences which 
are involved in gene regulation and/or transcribed and/or translated, such as those sequences which should be obtained after execution 
of steps (a); (c) the sequence contexts of all or a portion of the CpG dinucleotides or CpNpG trinucleotides contained in the amplified 
fragments are determined. 

(57) Zusammenfassung: Beschrieben ist ein Verfahren zur parallelen Detektion des Methylierungszustandes von genomischer 
DNA bei dem man folgende Schritte ausfiihrt: (a) in einer genomischen DNA Probe wandelt man durch chemische Behandlung an 
der 5' -Position unmethylierte Cytosinbasen in Uracil, Thymidin oder eine andere vom Hybridisierungsverhalten her dem Cytosin 
unahnliche Base um; (b) aus dieser chemisch behandelten genomischen DNA amplifiziert man mehr als zehn unterschiedliche Frag- 
mente, die jeweils weniger als 2000 Basenpaare lang sind, gleichzeitig durch Verwendung von synthetischen Oligonukleotiden als 
Primer, wobei diese Primer jeweils Sequenzen aus an der Genregulation beteiligten und/oder transkribierten und/oder translatierten 
genomischen Sequenzen enthalten, wie sie nach einer Behandlung gemaB Schritt (a) vorliegen wiirden; (c) man bestimmt den Se- 
quenzkontext aller oder eines Teils der in den amplifizierten Fragmenten enthaltenen CpG Dinukleotide oder CpNpG Trinukleotide. 
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Verfahren zur parallelen Detektion des Methylierungszustandes 

von genomischer DNA 

Die vorliegende Erfindung betrifft ein Verfahren zur parallelen Detektion des 
Methylierungszustandes von genomischer DNA. 

Die nach den methodischen Entwicklungen der letzten Jahre in der Molekularbiologie 
gut studierten Beobachtungsebenen sind die Gene selbst, die Ubersetzung dieser 
Gene in RNA und die daraus entstehenden Proteine. Wann im Laufe der Entwicklung 
eines Individuums welches Gen angeschaltet wird und wie Aktivieren und Inhibieren 
bestimmter Gene in bestimmten Zellen und Geweben gesteuert wird, ist mit hoher 
Wahrscheinlichkeit mit AusmaG und Charakter der Methylierung der Gene bzw. des 
Genoms korrelierbar. Insofern ist die Annahme naheliegend, daft pathogene Zustande 
sich in einem veranderten Methylierungsmuster einzelner Gene oder des Genoms 
auBern. 

Stand der Technik sind Verfahren, welche das Studium von Methylierungsmustern 
einzelner Gene gestatten. Jungere Fortentwicklungen dieser Methode erlauben auch 
die Analyse kleinster Mengen an Ausgangsmaterial. Die vorliegende Erfindung 
beschreibt ein Verfahren zur parallelen Detektion des Methylierungszustandes 
genomischer DNA Proben, wobei ausgehend von einer Probe gleichzeitig zahlreiche 
verschiedenene Fragmente aus an der Genregulation beteiligten oder/und 
transkribierten und/oder translatierten Sequenzen amplifiziert werden und anschlieftend 
der Sequenzkontext in den amplifizierten Fragmenten enthaltenen CpG Dinukleotide 
untersucht wird. 

5-Methylcytosin ist die haufigste kovalent modifizierte Base in der DNA eukaryotischer 
Zellen. Sie spielt beispielsweise eine Rolle in der Regulation der Transkription, 
genomischem Imprinting und in der Tumorgenese. Die Identifizierung von 5- 
Methylcytosin als Bestandteil genetischer Information ist daher von erheblichem 
Interesse. 5-Methylcytosin-Positionen konnen jedoch nicht durch Sequenzierung 
identifiziert werden, da 5-Methylcytosin das gleiche Basenpaarungsverhalten aufweist 
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wie Cytosin. Daruber hinaus geht bei einer PCR-Amplifikation die epigenetische 
Information, welche die 5-Methylcytosine tragen, vollstandig verloren. 
Die Modifikation der genomischen Base Cytosin zu 5-Methylcytosin stellt den bis heute 
wichtigsten und best-untersuchten epigenetischen Parameter dar. Trotzdem gibt es bis 
heute zwar Methoden, umfassende Genotypen von Zellen und individuen zu ermitteln, 
aber noch keine vergleichbaren Ansatze auch in grofcem Mafce epigenotypische 
Information zu generieren und auszuwerten. 

Es sind im Prinzip drei prinzipiell verschiedene Methoden bekannt, den 5-Methyl-Status 
eines Cytosins im Sequenzkontext zu bestimmen. 

Die erste prinzipielle Methode beruht auf der Verwendung von Restriktionsendo- 
nukleasen (RE), welche „methylierungssensitiv" sind. REs zeichnen sich dadurch aus, 
da(3> sie an einer bestimmten DNA-Sequenz, meist zwischen 4 und 8 Basen lang, einen 
Schnitt in die DNA einfuhren. Die Position solcher Schnitte kann dann durch 
Gelektrophorese, Transfer auf eine Membran und Hybridisierung nachgewiesen 
werden. Methylierungssensitiv bedeutet, dafc bestimmte Basen innerhalb der 
Erkennungssequenz unmethyliert vorliegen mussen, damit der Schnitt erfolgen kann. 
Das Bandenmuster nach einem Restriktionsschnitt und Gelektrophorese andert sich 
also je nach Methylierungsmuster der DNA. Allerdings befinden sich die wenigsten 
methylierbaren CpG innerhalb von Erkennungssequenzen von REs, konnen also nach 
dieser Methode nicht untersucht werden. 

Die Empfindiichkeit dieser Methoden ist extrem niedrig (Bird, A.P., and Southern, E.M., 
J.Mol. Biol. 118, 27-47). Eine Variante kombiniert PCR mit dieser Methode, eine 
Amplifikation durch zwei auf beiden Seiten der Erkennungssequenz liegende Primer 
erfolgt nach einem Schnitt nur dann, wenn die Erkennungssequenz methyliert vorliegt. 
Die Empfindiichkeit steigt in diesem Fall auf theoretisch ein einziges Molekul der 
Zielsequenz, allerdings konnen mit hohem Aufwand nur einzelne Positionen untersucht 
werden (Shemer, R. et al., PNAS 93, 6371-6376). Wiederum ist Voraussetzung, da(2> 
sich die methylierbare Position innerhalb der Erkennungssequenz einer RE befindet. 
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Die zweite Variante beruht auf partieller chemischer Spaitung von Gesamt-DNA, nach 
dem Vorbild einer Maxam-Gilbert Sequenzierreaktion, Ligation von Adaptoren an die so 
generierten Enden, Amplifikation mit generischen Primern und Auftrennung auf einer 
Gelektrophorese. Mit diesem Verfahren konnen definierte Bereiche bis zur Grofce von 
weniger als tausend Basenpaaren untersucht werden. Das Verfahren ist allerdings so 
kompliziert und unzuverlassig, daR es praktisch nicht mehr verwendet wird (Ward, C. et 
al., J. Bioi. Chem. 265, 3030-3033). 

Eine relativ neue und die mittlerweile am haufigsten angewandte Methode zur 
Untersuchung von DNA auf 5-Methylcytosin beruht auf der spezifischen Reaktion von 
Bisulphit mit Cytosin, das nach anschliefiender alkaiischer Hydrolyse in Uracil 
umgewandelt wird, welches in seinem Basen-Paarungsverhalten dem Thymidin 
entspricht. 5-Methylcytosin wird dagegen unter diesen Bedingungen nicht modifiziert. 
Damit wird die ursprungliche DNA so umgewandelt, dal2> Methylcytosin, welches 
ursprunglich durch sein Hybrid isierungsverhalten vom Cytosin nicht unterschieden 
werden kann, jetzt durch „normale" molekularbiologische Techniken als einzig 
verbliebenes Cytosin beispielsweise durch Amplifikation und Hybridisierung Oder 
Sequenzierung nachgewiesen werden kann. Alle diese Techniken beruhen auf 
Basenpaarung, welche jetzt voll ausgenutzt werden kann. Der Stand der Technik, was 
die Empfindlichkeit betrifft, wird durch ein Verfahren definiert, welches die zu 
untersuchende DNA in einer Agarose-Matrix einschliefet, dadurch die Diffusion und 
Renaturierung der DNA (Bisulphit reagiert nur an einzelstrangiger DNA) verhindert und 
alle Fallungs- und Reinigungsschritte durch schnelle Dialyse ersetzt (Olek, A. et al., 
Nucl. Acids. Res. 24, 5064-5066). Mit dieser Methode konnen einzelne Zellen 
untersucht werden, was das Potential der Methode veranschaulicht. Allerdings werden 
bisher nur einzelne Regionen bis etwa 3000 Basenpaare Lange untersucht, eine 
globale Untersuchung von Zellen auf Tausende von moglichen 
Methylierungsereignissen ist nicht moglich. Allerdings kann auch dieses Verfahren 
keine sehr kleinen Fragmente aus geringen Probenmengen zuverlassig analysieren. 
Diese gehen trotz Diffusionsschutz durch die Matrix verloren. 

Eine Ubersicht uber die weiteren bekannte Moglichkeiten, 5-Methylcytsosine 
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nachzuweisen, kann auch dem folgenden Ubersichtsartikel entnommen werden: Rein, 
T., DePamphilis, M. L, Zorbas, H., Nucleic Acids Res. 26, 2255 (1998). 

Die Bisulphit-Technik wird bisher bis auf wenige Ausnahmen (z.B. Zeschnigk, M. et al., 
Eur. J. Hum. Gen. 5, 94-98; Kubota T. et al., Nat. Genet. 16, 16-17) nur in der 
Forschung angewendet. Immer aber werden kurze, spezifische Stucke eines 
bekannten Gens nach einer Bisulphit-Behandlung amplifiziert und entweder komplett 
sequenziert (Olek, A. and Walter, J., Nat. Genet. 17, 275-276) oder einzelne Cytosin- 
Positionen durch eine „Primer-Extension-Reaktion" (Gonzalgo, M. L. and Jones, P.A., 
Nucl. Acids. Res. 25, 2529-2531) oder Enzymschnitt (Xiong, Z. and Laird, P.W., Nucl. 
Acids. Res. 25, 2532-2534) nachgewiesen. Zudem ist auch der Nachweis durch 
Hybridisierung beschrieben worden (Olek et al, W09928498). 

Gemeinsamkeiten zwischen Promotoren bestehen nicht nur im Vorkommen von TATA- 
oder GC-Boxen sondern auch darin, fur welche Transkriptionsfaktoren sie Bindestellen 
besitzen und in welchem Abstand diese sich zueinander befinden. Die existierenden 
Bindestellen fur ein bestimmtes Protein stimmen in ihrer Sequenz nicht vollstandig 
uberein, es finden sich aber konservierte Folgen von mindestens 4 Basen, die durch 
das Einfugen von „Wobbles", d. h. Positionen, an denen sich jeweils unterschiedliche 
Basen befinden, noch verlangert werden konnen. Des weiteren liegen diese 
Bindestellen in bestimmten Abstanden zueinander vor. 

Die Verteilung der DNA im Interphase-Chromatin, das den groftten Teil des nuklearen 
Volumens einnimmt, unterliegt jedoch einer ganz speziellen Ordnung. So ist die DNA 
an mehreren Stellen an die nukleare Matrix, eine filamentose Struktur an der Innenseite 
der nuklearen Membran, angeheftet. Diese Regionen bezeichnet man als matrix 
attachment regions (MAR) oder scaffold attachment regions (SAR). Das Anheften hat 
wesentlichen Einfluft auf die Transkription bzw. die Replikation. Diese MAR-Fragmente 
weisen keine konservativen Sequenzen auf, bestehen allerdings zu 70% aus A bzw. T 
und liegen in der Nahe von cis-agierenden Regionen, die die Transkription allgemein 
regulieren, und Topoisomerase ll-Erkennungsstellen. 
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Neben Promotoren und Enhancern existieren weitere regulatorische Elemente fur 
verschiedene Gene, sogenannte Insulators. Diese Insulators konnen z.B. die Wirkung 
des Enhancers auf den Promotor inhibieren, wenn sie zwischen Enhancer und 
Promotor liegen, oder aber, zwischen Heterochromatin und einem Gen gelegen, das 
aktive Gen vor dem EinfluB des Heterochromatins schutzen. Beispiele fur solche 
Insulators sind: 1. sogenannte LCR (locus control regions), welche aus mehreren 
gegenuber DNAase I hypersensitiven Stellen besteht; 2. bestimmte Sequenzen wie 
SCS (specialized chromatin structures) bzw. SCS', 350 bzw. 200 bp lang und hoch- 
resistent gegen Degradierung durch DNAase I und auf beiden Seiten von 
hypersensitiven Stellen flankiert (Abstand je 100 bp). An scs' bindet das Protein BEAF- 
32. Diese Insulators konnen auf beiden Seiten des Gens liegen. 

Eine Ubersicht uber den Stand der Technik in der Oligomer Array Herstellung lalit sich 
auch einer im Januar 1999 erschienen Sonderausgabe von Nature Genetics (Nature 
Genetics Supplement, Volume 21, January 1999) und der dort zitierten Literatur 
entnehmen. 

Patente, die sich allgemein auf die Verwendung von Oligomer Arrays und 
photolithographisches Maskendesign beziehen, sind z. B. US-A 5,837,832, US-A 
5,856,174, WO-A 98/27430 und US-A 5,856,101. Zudem existieren einige Stoff- und 
Verfahrenspatente, welche die Verwendung photolabiler Schutzgruppen an 
Nukleosiden einschranken, so z. B. WO-A98/39348 und US-A 5,763,599. 

Matrix-assistierte Laser Desorptions/lonisations Massenspektrometrie (MALDI) ist eine 
neue, sehr leistungsfahige Entwicklung fur die Analyse von Biomolekulen (Karas, M. 
and Hillenkamp, F. 1988. Laser desorption ionization of proteins with molecular masses 
exceeding 10.000 daltons. Anal. Chem. 60: 2299-2301). Ein Analytmolekul wird in eine 
im UV absorbierende Matrix eingebettet. Durch einen kurzen Laserpuls wird die Matrix 
ins Vakuum verdampft und das Analyt so unfragmentiert in die Gasphase befordert 
Eine angelegte Spannung beschleunigt die lonen in ein feldfreies Flugrohr. Auf Grund 
ihrer verschiedenen Massen werden lonen unterschiedlich stark beschleunigt. Kleinere 
lonen erreichen den Detektor fruher als groBere und die Flugzeit wird in die Masse der 
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lonen umgerechnet. 

Fur die Abtastung eines immobilisierten DNA-Arrays sind vielfach fluoreszent markierte 
Sonden verwendet worden. Besonders geeignet sind fur die Fluoreszenzmarkierung ist 
das einfache Anbringen von Cy3 und Cy5 Farbstoffen am 5'OH der jeweiligen Sonde. 
Die Detektion der Fluoreszenz der hybridisierten Sonden erfolgt beispielsweise uber ein 
Konfokalmikroskop. Die Farbstoffe Cy3 und Cy5 sind, neben vielen anderen, 
kommerziell erhaltlich. 

Um die erwartete Anzahl von amplifizierten Fragmenten ausgehend von einer 
beliebigen Templat-DNA und zweien nicht fur jeweils eine bestimmte Position 
spezifischen Primern zu berechnen, mu(J ein statistisches Modell uber den Aufbau des 
Genoms zu Grunde gelegt werden. 

Wir geben hier die Berechnung fur drei Modelle an, beziehen uns allerdings in diesem 
Patent auf die in Modell 3 beschriebene Methode. 

Modell 1 : 

Im einfachsten Fall wird angenommen, daft ein primarer DNA-Strang eine Zufallsfolge 
von vier gleich haufig vorkommenden Basen ist. Damit ergibt sich als 
Wahrscheinlichkeit, daft sich fur einen beliebiger Primer PrimA (der Lange k) an einer 
gegebenen Stelle im Genom eine perfekte Basenpaarung ergibt: 

P a {PrimA) = 0.25 k (Modell 1 fur DNA) 

(diese Wahrscheinlichkeit ist fur den sense- und anti-sense-Strang der DNA gleich) 

Bei einer Bisulfitbehandlung der DNA werden diejenigen Cytosine durch Uracil ersetzt, 
die nicht zu einem methylierten CG gehoren. Das Basenpaarungsverhalten des Uracils 
entspricht dem des Thymins. Da CG in der DNA sehr selten sind (unter zwei Prozent), 
kann die statistische Haufigkeit der Cs nach der Bisulfitbehandlung vernachlassigt 
werden. Die Wahrscheinlichkeit, daft sich fur einen Primer PrimB (Lange /e, davon a As, 
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t Ts, g Gs und c Cs) auf bisulfitbehandelter DNA eine perfekte Basenpaarung ergibt, ist 
unterschiedlich fur einen mit Bisulfit behandelten Strang und den zugehdrigen anti- 
sense Strang: 

P h {PrimB)=0.5 a *0.25' *0.25 c *O g (Modell 1 fur Bisulfit-DNA-Strang) 

P Ia (PrimB)=Q.25 a *0.5 ( *0 c *0.25 g (Modell 1 fur anti-sense-Strang zu einem 
Bisulfit-DNA-Strang) 

(wenn der Primer C oder G enthalt, wird somit einer der Wahrscheinlichkeitswerte 0). 
Modell 2: 

Zahlungen der Basenhaufigkeiten der DNA ergeben, daI3> die vier Basen in der DNA 
nicht gleichverteilt sind. Entsprechend kann man aus DNA-Datenbanken folgende 
Haufigkeiten (Wahrscheinlichkeiten fur ein Vorkommen) der Basen ermitteln. 

P DNA (A)=0.28ll 
P DNA (T >0.2784 
P DNA (C) = 0.2206 
P DNA (G)=0.2199 

Als Grundlage fur diese Statistik (und die folgenden fur Modell 2 und 3) dienen ca. 6% 
des Genoms vom Homo Sapiens aus High Throughput Sequencing Projekten 
(Datenbank "htgs" vom NIH/NCBI vom 6.9.1999). Die Gesamtmenge der Daten betragt 
mehr als 1.5x10 8 Basenpaare, was einem Schatzfehler fur die 
Einzelwahrscheinlichkeiten kleiner 10 5 entspricht. 

Mit Hilfe dieser Werte laBt sich das Modell 1 verbessern. 

Damit ist die Wahrscheinlichkeit, daB sich fur einen Primer PrimC (Lange /c, davon a 
As, t Ts, g Gs und c Cs) eine perfekte Basenpaarung ergibt: 
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P 2 (PrimC)=P DNA (TT *P DNA (A)'*P DNA (Cf *P DNA (G) c (Modell 3 fur DNA) 

Fur den mit Bisulfit behandelten Strang ergeben sich folgende Wahrscheinlichkeiten 
unter der Annahme, dal3> alle CpG-Positionen methyliert sind (man erhalt eine gleiche 
Statistik fur die Bisulfitbehandlung des DNA-sense- und des DNA-antisense-Stranges): 

P bDNA (A)=0.2Sll 
^(C)=0.0140 
P bDNA (G)=0.2199 
P bDNA (T)=0A&50 

Damit ergibt sich als Wahrscheinlichkeit, daR sich fur einen Primer PrimD (Lange k, 
davon a As, t Ts, g Gs und c Cs) eine perfekte Basenpaarung ergibt: 

P 2 APrimD)=P bDNA (T) a *P bDNA (A)^ (Modell 3 fur Bisulfit-DNA- 
Strang) 

P 2a (PrimD)=P bDNA (A) a *P bDNA (T)'*P bDNA (G) 8 *P bDNA (C) c (Modell 3 fur anti-sense- 
Strang zu einem Bisulfit-DNA-Strang) 

Modell 3: 

Wesentliche Schatzfehler in Modell 2 ergeben sich vor allem bei der mit Bisulfit 
behandelten DNA aus der Tatsache, dad C nur noch im Kontext CG auftreten kann. 
Modell 3 berucksichtigt diese Eigenschaft und nimmt an, daB die primare DNA eine 
Zufallsfolge mit Abhangigkeit direkt benachbarter Basen ist (Markov-Kette erster 
Ordnung). Die empirisch aus der Datenbank (vollstandig methyliert; mit Bisulphit 
behandelt) ermittelten paarweisen Basenwahrscheinlichkeiten ergeben sich gleich fur 
beide DNA-Strange als P bDNA {von;nach) aus der folgenden Tabelle: 
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Von\nach 


A 


C 


G 


T 


A 


0.0894 


0.0033 


0.0722 


0.1162 


C 


0.0 


0.0 


0.0140 


0.0 


G 


0.0603 


0.0036 


0.0601 


0.0959 


T 


0.1314 


0.0071 


0.0736 


0.2729 



P bDNA (A)=0.2%\\ 

JWC)=0.0140 
P bDNA {G)=Q.2\99 
P bDNA {T)=QA%50 



und fur den dazu revers-komplementaren Strang (durch entsprechendes Austauschen 
der Eintrage) P rbDNA ( von > nach) 



Von\nach 


A 


C 


G 


T 


A 


0.2729 


0.0959 


0.0 


0.1162 


C 


0.0736 


0.0601 


0.0140 


0.0722 


G 


0.0071 


0.0036 


0.0 


0.0033 


T 


0.1314 


0.0603 


0.0 


0.0894 



P rbDNA (A)=0AS50 ; 
P rbDNA (C)=0.2l99 
P rbDNA (G)=0.0140 
P rbDNA (T)=0.2SU 



Damit hangt die Wahrscheinlichkeit, dafi sich fur einen Primer PrimE (mit der 
Basenfolge Bi B 2 B 3 B 4 z.B. ATTG...) eine perfekte Basenpaarung ergibt, von der 
genauen Abfolge der Basen ab und ergibt sich als das Produkt: 

P ( P„-„,rr\— P I n \ P rbDN A (-^1 ' ^l) ? ' rbDNJl 2 >_ P rt>DN A U*3 ^4 ) ... , „ - ... 

F 3s {FrimL)-P rbDNA {B x ) — ■— - — — ... (Modell 3 fur 

r rbDN A \- D \) r rbDN A \ £S 21 * rbDmK 1 *?,) 
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Bisulfit-DNA-Strang) 

P (PrirnF\-P (P \ P *>D^ ( B } >' B 2) P ' bDNA^ 2 >' B '3) P bDNA^ 3 '> B 4) , „ 0 ... 

r 3a {Frimt)-F bDNA {B x ) — — — ... (Modell 3 fur 

r bDM\ D \) r bDNA\ U 2J * bDNA V ^ 3 / 

anti-sense-Strang zu einem Bisulfit-DNA-Strang) 

Berechnung der Anzahl derzu erwartenden amplifizierten Fragmente 

Die mit Bisulfit behandelte DNA wird unter Benutzung einer Anzahl Primer amplifiziert. 
Aus Sicht des Modells besteht die DNA aus je einem sense- und einem anti-sense- 
Strang der Lange N Basen (alle Chromosomen werden hier zusammengefaSt). Fur 
einen Primer Prim ist zu erwarten, daf3> er auf dem sense-Strang 

N*P s (Prim) 

perfekte Basenpaarungen ergibt - fur diese Berechnung konnen die Funktionen P 1s , P 2 
Oder P 3s von Modell 1 , 2 oder 3 eingesetzt werden, je nach gewunschter 
Abschatzungsgute. Werden mehrere Primer (PrimU, PrimV, PrimW, PrimX, etc.) 
gleichzeitig verwendet, ergibt sich als Wahrscheinlichkeit fur eine perfekte 
Basenpaarung auf dem sense-Strang an einer gegebenen Position: 

P s ( Primers ) = P s ( Prim U ) 

4- ( 1 - P s ( Prim U ) ) P s ( Prim V ) 

+ {\ - P s {PrimU)){\- P s {PrimV)) P s {PrimW) 

+ {\-PSPrimU)){\-P^PrimV)){\-P s {PrimW))P s {PrimX) 

+ ... 

Und damit als Anzahl der zu erwartenden perfekten Basenparungen mit irgendeinem 
der Primer 

N *P s {Primers) 
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Fur die Bestimmung von P a (Primers) auf dem anti-sense-Strang werden die analogen 
Gleichungen verwendet. Ein Amplifikat entsteht genau dann, wenn bei einer perfekten 
Basenpaarung auf dem sense-Strang innerhalb der maximalen Fragmentlange /Wein 
Primer auf dem Gegenstrang eine perfekte Basenpaarung bildet. Die 
Wahrscheinlichkeit dafur ist 



P u (Primers) 2^ i=0 ( 1 ~P a [Primers)) 



Fur groBe M und kleine P a (Primers) kann dieses durch folgenden Ausdruck berechnet 
werden: 

\-P a (Primers) . M 



log ( 1 — P a ( Primers ) ) 



[(\-P a (Primers)) M ~\] 



Fur die Gesamtzahl F der Fragmente, die durch die Amplifikation beider Strange zu 
erwarten sind, ergibt sich damit: 



( 1 — P ( Primers ) ) 

F=N*P S ( Primers ) - " — . [ ( 1 - />, ( Primers ) ) A/ - 1 ] 

log ( 1 — P a ( Primers ) ) 

(\—P{ Primers)) 

+ N*P a { Primers ) - - ~ — ^ [ ( 1 - P s ( Primers ) ) M - 1 ] 

aV ; log [\-P s {Primers)) 1 ' sV ; J 



Diese Methode liefert einen prazisen Erwartungswert fur die Vorhersage der Anzahl der 
Bindungssites bestimmter Sequenzen an ein beliebiges zuvor mit Bisulfit behandeltes 
genomisches DNA Fragment. Sie dient hier als Grundlage fur die Berechnung der 
statistisch erwarteten Anzahl von Amplifikaten in einer PCR-Reaktion ausgehend von 
zwei Primersequenzen und einer DNA der Lange N, wobei nur die Amplifikate 
berticksichtigt werden, die eine Anzahl von M Nukleotiden nicht uberschreiten. In 
diesem Patent wird davon ausgegangen, daB M den Wert 2000 hat. 
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Die bekannten Verfahren fur den Nachweis von Cytosin Methylierungen in genomischer 
DNA sind prinzipiell nicht so ausgelegt, da(3> eine Vielzahl von Zielregionen im zu 
untersuchenden Genom gieichzeitig erfaflt werden. Aufgabe der vorliegenden 
Erfindung ist es, ein Verfahren zu schaffen, mit dem eine Probe genomischer DNA 
gieichzeitig an mehreren Positionen gieichzeitig auf Cytosin Methylierung hin 
untersucht werden kann. 

Die Aufgabe wird durch die kennzeichnenden Merkmale des Anspruchs 1 gelost. 
Vorteilhafte Weiterbildungen der Merkmal sind in den abhangigen Anspruchen 
gekennzeichnet. 

Im Unterschied zu anderen Verfahren kann nach chemischer Vorbehandlung der DNA 
durch Verwendung entsprechend angepa&ter Primerpaare eine Amplifikation von vielen 
Zielregionen gieichzeitig erfolgen. Dabei ist es nicht unbedingt notwendig den 
Sequenzkontext aller dieser Zielregionen vorab zu kennen, da in vielen Fallen, wie 
nachfolgend auch beispielhaft aufgefiihrt, Konsensussequenzen aus der 
Sequenzierung verwandter Zielregionen bekannt sind, die wie unten beschrieben fur 
das Design fur bestimmte Zielregionen spezifischer oder selektiver Primerpaare 
eingesetzt werden konnen. Das Verfahren ist dann erfolgreich angewandt, wenn die 
Amplifikation der chemisch vorbehandelten genomischen DNA mehr Fragmente bis 
maximal 2000 Basenpaare Lange als statistisch zu erwarten aus den jeweils zu 
untersuchenden Zielregionen liefert. 

Dabei wird der statistische Erwartungswert fur die Anzahl dieser Fragmente uber die im 
Stand der Technik aufgefuhrten Formeln berechnet. Die Anzahl der im 
Amplifikationsschritt hergestellten Fragmente kann dagegen mittels einer beliebigen 
molekularbiologischen, chemischen oder physikalischen Methode nachgewiesen 
werden. 

Fur die Durchfuhrung der erforderlichen statistischen Betrachtungen, die auch fur die 
unten aufgefuhrten Anspruche relevant sind, werden die folgenden Werte 
angenommen: 
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Das menschliche haploide Genom enthalt 3 Milliarden Basenpaare und 100.000 Gene, 
die wiederum im Mittel eine 2000 Basenpaare lange mRNA codieren, die Gene 
inklusive der Introns sind durchschnittlich 15000 Basenpaare lang. Promotoren 
umfassen je Gen 1000 Basenpaare durchschnittlich. 1st daher der statistische 
Erwartungswert fur die Anzahl der Amplifikate, die ausgehend von zwei Primern in 
transkribierten Sequenzen liegen, zu berechnen, so ist zunachst der Erwartungswert fur 
das Gesamtgenom nach obiger Formel (Methode 3) zu berechnen und mit dem Anteil 
der transkribierten Sequenzen am Gesamtgenom zu berechnen. Analog wird fur Teile 
eines beliebigen Genoms sowie fur Promotoren und translatierte Sequenzen (mRNA 
codierend) vorgegangen. 

Die vorliegende Erfindung beschreibt somit ein Verfahren zur parallelen Detektion des 
Methylierungszustandes genomischer DNA. Dabei sollen mehrere Cytosin- 
Methylierungen in einer DNA-Probe gleichzeitig analysiert werden. Dazu werden die 
folgenden Verfahrensschritte nacheinander ausgefuhrt: 

Zuerst wird eine genomische DNA Probe derart chemisch behandelt, daft an der 5'- 
Position unmethylierte Cytosinbasen in Uracil, Thymin oder eine andere vom 
Hybridisierungsverhalten her dem Cytosin unahnliche Base verwandelt werden. 
Bevorzugt wird dazu die oben beschriebene Behandlung genomischer DNA mit Bisulfit 
(Hydrogensulfit, Disulfit) und anschlieRender alkalischer Hydrolyse verwendet, die zu 
einer Umwandlung nicht methylierter Cytosin-Nukleobasen in Uracil fuhrt. 

In einem zweiten Verfahrensschritt werden aus der vorbehandelten genomischen DNA 
mehr als zehn unterschiedliche Fragmente gleichzeitig durch Verwendung von 
synthetischen Oligonukleotiden als Primer amplifiziert, wobei mehr als doppelt so viele 
Fragmente als statistisch zu erwarten aus an der Genregulation beteiligten, 
transkribierten und/oder translatierten Sequenzen stammen. Dies kann mittels 
verschiedener Methoden erreicht werden. 

In einer bevorzugten Variante des Verfahrens enthalt mindestens eines der fur die 
Amplifikation verwendeten Oligonukleotide weniger Nukleobasen als es statistisch fur 
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eine sequenzspezifische Hybridisierung an die chemisch behandelte genomische DNA 
Probe erforderlich ware, was zur Amplifikation mehrerer Fragmente gleichzeitig fiihren 
kann. Dabei ist die Gesamtzahl der in diesem Oligonukleotid enthaltenen Nukleobasen 
kleiner als 17. In einer besonders bevorzugten Variante des Verfahrens ist die Anzahl 
der in diesem Oligonukleotid enthaltenen Nukleobasen kleiner als 14. 

In einer weiteren, bevorzugten Variante des Verfahrens werden fur die Amplifikation 
mehr als 4 Oligonukleotide mit unterschiedlicher Sequenz gleichzeitig in einem 
Reaktionsgefaft verwendet. In einer besonders bevorzugten Varianten werden zur 
Herstellung eines komplexen Amplifikates mehr als 26 verschiedene Oligonukleotide 
gleichzeitig verwendet. In einer besonders bevorzugten Variante des Verfahrens 
stammt mehr als eine doppelt so hohe Anzahl, wie statistisch zu erwarten, aus an der 
Regulation von Genen beteiligten Genomabschnitten, z.B. Promotoren und Enhancern, 
stammt, als bei einer rein zufalligen Wahl der Oligonukleotidsequenzen zu erwarten 
ware. In einer weiteren besonders bevorzugten Variante des Verfahrens stammt mehr 
als eine doppelt so hohe Anzahl der amplifizierten Fragmente aus Genomabschnitten, 
die in mindestens einer Zelle des jeweiligen Organismus in mRNA transkribiert werden, 
oder aber aus nach der Transkription in mRNA gespliceten Genomabschnitten 
(Exons), als bei einer rein zufalligen Wahl der Oligonukleotidsequenzen zu erwarten 
ware. 

In einer weiteren besonders bevorzugten Variante des Verfahrens stammt mehr als 
eine doppelt so hohe Anzahl der amplifizierten Fragmente aus Genomabschnitten, 
welche fur Teile einer oder mehrerer Genfamilien kodieren, oder aber sie stammen aus 
Genomabschnitten, welche fur sogenannte „matrix attachment sites" (MARs)- 
charakteristische Sequenzen enthalten, als bei einer rein zufalligen Wahl der 
Oligonukleotidsequenzen zu erwarten ware. 

In einer weiteren besonders bevorzugten Variante des Verfahrens stammt mehr als 
eine doppelt so hohe Anzahl der amplifizierten Fragmente aus Genomabschnitten, 
welche als sogenannte „boundary elements" die Verpackungsdichte des Chromatins 
organisieren, oder aber sie stammen aus multiple drug resistance gene" (MDR)- 
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Promotoren oder kodierenden Regionen, als bei einer rein zufalligen Wahl der 
Oligonukleotidsequenzen zu erwarten ware. 

In einer weiteren, besonders bevorzugten Variante des Verfahrens werden zur 
Amplifkation der beschriebenen Fragmente zwei Oligonukleotide oder zwei Klassen von 
Oligonukleotiden verwendet, von denen eines oder eine Klasse aufter im Kontext CpG 
oder CpNpG zwar die Base C enthalten kann, nicht aber die Base G und von denen 
das andere oder die andere Klasse auSer im Kontext CpG oder CpNpG zwar die Base 
G, nicht aber die Base C enthalten kann. 



In einer weiteren bevorzugten Variante des Verfahrens wird die Amplifikation mittels 
zweier Oligonukleotide durchgefuhrt, von denen eines eine vier bis sechzehn Basen 
lange Sequenz enthalt, die zu einer solchen DNA komplementar ist oder dieser 
entspricht, wie sie entstehen wurde, wenn ein ebenso langes DNA Fragment, an 
welches einer der Faktoren 



AhR/Arnt 

Arnt 
AMU a 

AP-1 

C/EBP 

C/EBPalpha 

C/EBPbeta 

CDP 

CDP 

CDP CR1 
CDP CR3 
CHOP-C/EBPalpha 

c-Myc/Max 

CREB 
CRE-BP1 



CRE-BP1/c-Jun 



aryl hydrocarbon receptor/aryl hydrocarbon receptor nuclear 
translocator 

aryl hydrocarbon receptor nuclear translocator 
CBFA2; core-binding factor, runt domain, alpha subunit 2 
(acute myeloid leukemia 1; aml1 oncogene) 
activator protein-1 (AP-1); Synonyme: c-Jun 
CCAAT/enhancer binding protein 
CCAAT/enhancer binding protein (C/EBP), alpha 
CCAAT/enhancer binding protein (C/EBP), beta 
CUTL1; cut (Drosophila)-like 1 (CCAAT displacement 
protein) 

CUTL1; cut (Drosophila)-like 1 (CCAAT displacement 
protein) 

complement component (3b/4b) receptor 1 

complement component (3b/4b) receptor 3 

DDIT; DNA-damage-inducible transcript 3/CCAAT/enhancer 

binding protein (C/EBP), alpha 

avian myelocytomatosis viral oncogene/MYC-ASSOCIATED 
FACTOR X 

cAMP responsive element binding protein 
CYCLIC AMP RESPONSE ELEMENT-BINDING PROTEIN 
2, CREB2, CREBP1; now ATF2; activating transcription 
factor 2 

activator protein-1 (AP-1); Synonyme: c-Jun 
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CREB 
E2F 



E47 

E47 

Egr-1 
Egr-2 
ELK-1 

Freac-2 

Freac-3 

Freac-4 

Freac-7 

GATA-1 
GATA-1 
GATA-1 
GATA-2 
GATA-3 
GATA-X 
HFH-3 

HNF-1 

HNF-4 

IRF-1 

ISRE 

Lmo2 complex 
MEF-2 

MEF-2 

myogenin/NF-1 
MZF1 
MZF1 
NF-E2 

NF-kappaB (p50) 
NF-kappaB (p65) 



MP responsive element binding protein 
E2F transcription factor (originally identified as a DNA- 
binding protein essential E1A-dependent activation of the 
adenovirus E2 promoter) 

transcription factor 3 (E2A immunoglobulin enhancer binding 
factors E12/E47) 

transcription factor 3 (E2A immunoglobulin enhancer binding 
factors E12/E47) 
early growth response 1 

early growth response 2 (Krox-20 (Drosophila) homolog) 
ELK1 , member of ETS (environmental tobacco smoke) 
oncogene family 

FKHL6; forkhead (Drosophila)-like 6; FORKHEAD-RELATED 
ACTIVATOR 2; FREAC2 

FKHL7; forkhead (Drosophila)-like 7; FORKHEAD-RELATED 
ACTIVATOR 3; FREAC3 

FKHL8; forkhead (Drosophila)-like 8; FORKHEAD-RELATED 
ACTIVATOR 4; FREAC4 

FKHL1 1 ; forkhead (Drosophila)-like 9; FORKHEAD- 
RELATED ACTIVATOR 7; FREAC7 
GATA-binding protein 1 /Enhancer-Binding Protein GATA1 
GATA-binding protein 1 /Enhancer-Binding Protein GATA1 
GATA-binding protein 1 /Enhancer-Binding Protein GATA1 
GATA-binding protein 2/Enhancer-Binding Protein GATA2 
GATA-binding protein 3/Enhancer-Binding Protein GATA3 

FKHL10; forkhead (Drosophila)-like 10; FORKHEAD- 
RELATED ACTIVATOR 6; FREAC6 

TCF1; transcription factor 1, hepatic; LF-B1, hepatic nuclear 

factor (HNF1), albumin proximal factor 

hepatocyte nuclear factor 4 

interferon regulatory factor 1 

interferon-stimulated response element 

LIM domain only 2 (rhombotin-like 1) 

MADS box transcription enhancer factor 2, polypeptide A 

(myocyte enhancer factor 2A) 

MADS box transcription enhancer factor 2, polypeptide A 
(myocyte enhancer factor 2A) 
Myogenin (myogenic factor 4)/Neurofibromin 1; 
NEUROFIBROMATOSIS, TYPE I 

ZNF42; zinc finger protein 42 (myeloid-specific retinoic acid- 
responsive) 

ZNF42; zinc finger protein 42 (myeloid-specific retinoic acid- 
responsive) 

NFE2; nuclear factor (erythroid-derived 2), 45kD 

nuclear factor of kappa light polypeptide gene enhancer in B- 

cells p50 subunit 

nuclear factor of kappa light polypeptide gene enhancer in B- 
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cells p65 subunit 


1 1 i , _ „ r~> 

NF-kappab 


nuclear Tactor ot Kappa ugnt polypeptide gene ennancer in d- 




cells 


Nr-Kappao 


nuciear Tactor ot Kappa ngni poiypeptiae gene ennancer in d- 




cells 


KID OUT 

NKbr 


MCI IDHM DCCTDIPTI\/C CII CMPPP CAPTHD' DCCT' PP1 

NLUKUN KLo I KIU I IVt: oILtNUtK rAU I UK, Kto I , Kt I- 




silencing transcription factor 


UCt-T 


UU I AlVltzK-DlNUINL? I KAINoUKtK I IUN rMU I Ur\ I , 




rUU^ri, rUU domain, class z, transcription tactor i 


UCt-1 


HPTA l\ /I d D DIMni MP TDAMCPDIDTinM CAPTHD 1 • 

UU I AMtK-DlNUINo I KANoUKir I IUN rAU I UK I, 




ruuzr i , ruu domain, ciass z, Transcription Tactor i 


Oct-1 


UU 1 AMbK-blNUINu 1 KANoLKIr 1 IUN rAU 1 UK i , 




ruuzr I , r uu domain, ciass Transcription Tactor i 


UCt- 1 


nrTAMFR RiMniMr^ tram^priptiom fapthr 1- 

UU 1 Ml VI IZ rx-DI l\ LJ 1 1 n vj 1 rxMINOUPvl i 1 1 rMU 1 Ur\ 1 , 




ruuzr i , nuu aomam, ciass z, transcription Tactor i 


UCt- I 


Or*TAMPP RIMHIM^ TDAMQPRIPTIPlM FAPTOR 1- 
UU I AM t K-Dll\UllN^j I KAlNOUKIr I IUIn rAU I UK I , 




ruuzr i, ruu oomain, ciass z, transcription Tactor i 


KoUU 


t ia ^aaenovirus t ia oncoproteinj-DiiNLJiiNU rr\u i ciim, 




oUU-rxD 


TOO 


tumor protein poo (Li-rraumeni syndrome;, i roo 


rax- I 


pcxireu uux yene i 


Kax-o 


paireo dox gene o ^vvaaraenDurg synarome i j 


Kax-o 


pairea dox gene o ^anlrlala, Keratins; 


Phv 1 h 
rDX I D 


pre-D-oeii leuKeriiia uariocripuun laciuf 


Dkv 1 
rDX- I 


pre-D-ceii leuKemia transcription Tactor i 


KUKaipnaz 


PAR RPI ATFn ORPHAN RCPPPTOR AI PMA- RFTIMHIP 


Apin RiKiniMr^ ppppptop ai pwa 

AUILJ-DIIMLJIINVj KtUtr 1 UK ALrnA 


KKtb- I 


ras responsive element Dinoing protein 1 


on I 


simian-virus-^f u-protem- i 




O i m ion \;in in /i pi ■ f» "1 

simian-virus-H-u-pr oxein- i 


CDCDD A 

oKhbr-i 


sterol regulatory element Dinoing transcription Tactor i 


oKr 


serum resporibe Tacior ^o-TOb serurii reoporibe eieiiieiu- 




uinuing iranscripxion Tcactor; 


cpv 


sex uetermining region t 


QTATO 

o in! O 


signal transducer diiu activator ot transcription i, y \ i\u 


i ai- 1 aipna/t^f / 


i -ceil acute lympnocytic leuKemia i /transcription Tactor o 




(^tzA immunogioDuiin ennancer Dinoing Tactors tz iz/ch-/ ; 


"TATA 

1 A 1 A 


cellular and viral TATA box elements 


Tav/PRPR 
1 dX/Ur\CD 


1 1 di ibieriiiy-expr cbbcu axoncii giyooproieiri/OMivir^ leopurioive 




element uniuiiiy pruiein 


Tay/PRFR 


i i di ioici i iiy ca|ji coocu aAUi icji y ly uupi uicii i/oAAivin i copui loivu 




element binding protein 


TCF1 1/MafG 


v-maf musculoaponeurotic fibrosarcoma (avian) oncogene 




family, protein G 


TCF11 


Transcription Factor 11; TCF11; NFE2L1; nuclear factor 




(erythroid-derived 2)-like 1 


USF 


upstream stimulating factor 


Whn 


winged-helix nude 
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X-BP-1 
YY1 



X-box binding protein 1 oder 

ubiquitously distributed transcription factor belonging to 
theGLI-Kruppel class of zinc finger proteins 



bindet, derart chemisch behandelt wurde, dad an der 5'-Position unmethylierte 
Cytosinbasen in Uracil, Thymidin oder eine andere vom Hybridisierungsverhalten her 
dem Cytosin unahnliche Base verwandelt werden. 

In einer weiteren bevorzugten Variante des Verfahrens wird die Amplifikation mittels 
zweier Oligonukleotide oder zweier Klassen von Oligonukleotiden durchgefuhrt, von 
denen eines oder die eine Klasse die vier bis sechzehn Basen lange Sequenz enthalt, 
welche zu einer solchen DNA komplementar ist oder dieser entspricht, wie sie 
entstehen wurde, wenn ein ebenso ianges DNA Fragment, welches uber seine 
Sequenz oder Sekundarstruktur die spezifische Lokalisierung von 
Genom/Chromatinabschnitten innerhalb des Zellkerns herbeifuhren kann, derart 
chemisch behandelt wurde, daS an der 5'-Position unmethylierte Cytosinbasen in 
Uracil, Thymidin oder eine andere vom Hybridisierungsverhalten her dem Cytosin 
unahnliche Base verwandelt werden. 

In einer weiteren bevorzugten Variante des Verfahrens wird die Amplifikation mittels 
zweier Oligonukleotide oder zweier Klassen von Oligonukleotiden durchgefuhrt, von 
denen eines oder die eine Klasse eine der Sequenzen 

TCGCGTGTA, TACACGCGA, TGTACGCGA, TCGCGTACA, 
TTGCGTGTT, AACACGCAA, GGTACGTAA, TTACGTACC, 
TCGCGTGTT, AACACGCGA, GGTACGCGA, TCGCGTACC, 
TTGCGTGTA, TACACGCAA, TGTACGTAA, TTACGTACA, 
TACGTG, CACGTA, TACGTG, CACGTA, 

ATTGCGTGT, ACACGCAAT, GTACGTAAT, ATTACGTAC, 
ATTGCGTGA, TCACGCAAT, TTACGTAAT, ATTACGTAA, 
ATCGCGTGA, TCACGCGAT, TTACGCGAT, ATCGCGTAA, 
ATCGCGTGT, ACACGCGAT, GTACGCGAT, ATCGCGTAC, 
TGTGGT, ACCACA, ATTATA, TATAAT, 



TGAGTTAG, CTAACTCA, TTGATTTA, TAAATCAA, 
TGATTTAG, CTAAATCA, TTGAGTTA, TAACTCAA, 
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TTTGGT, ACCAAA, ATT AAA, TTTAAT, 
TGTGGA, TCCACA, TTTATA, TAT AAA , 
TTTGGA, TCCAAA, TTTAAA, TTTAAA, 
TGTGGT, ACCACA, ATTATA, TATAAT, 

ATTAT, ATAAT, GTAAT, ATT AC, 
ATTGT, ACAAT, GTAAT, ATTAC, 

GAAAG, CTTTC, TTTTT, AAAAA, 
GTAAT, ATTAC, ATTGT, ACAAT, 
GAAAT, ATTTC, ATTTT, AAAAT, 
GTAAG CTTAC TTTGT ACAAA 

TTAAT AATC GAT , ATCGATTATTAA, ATCG ATTATTG G , CCAATAATCGAT, 
ATCGATTA, TAATCGAT, TAATCGAT, ATCG ATT A, 

ATCGATCGG, CCGATCGAT, TCGATCGAT, ATCGATCGA, 
ATCGATCGT, ACGATCGAT, GCGATCGAT, ATCGATCGC, 

TATCGATA, TATCGATA, TATCGGTG, CACCGATA, 
TATTAATA, TATTAATA, TATTGGTG, CACCAATA, 

GTGTAATATTT, AAATATTAC AC , GGGTATTGTAT, ATACAATACCC, 
GTGTAATTTTT, AAAAATTACAC, GGGGATTGTAT, ATACAATCCCC, 
ATGTAATTTTT, AAAAATTAC AT , GGGGATTGTAT, ATACAATCCCC, 
ATGTAATATTT, AAATATTAC AT , GGGTATTGTAT, ATACAATACCC, 
ATTACGTGGT, ACCACGTAAT, ATTACGTGGT, ACCACGTAAT, 
TGACGTAA, TTACGTCA, TTACGTTA, TAACGTAA, 
TGACGTTA, TAACGTCA, TGACGTTA, TAACGTCA, 
TTACGTAA, TTACGTAA, TTACGTAA, TTACGTAA, 
TGACGTTA, TAACGTCA, TAACGTTA, TAACGTTA, 

TGACGT, ACGTCA, GCGTTA, TAACGC, 
TGACGT, ACGTCA, ACGTTA, TAACGT, 
TTTCGCGT, ACGCGAAA, GCGCGAAA, TTTCGCGC, 
TTTGGCGT, ACGCCAAA, GCGTTAAA, TTTAACGC, 

TAGGTGTTA, TAACACCTA, TAATATTTG, CAAATATTA, 
TAGGTGTTT, AAACACCTA, GAATATTTG, CAAATATTC, 

GTAGGTGG, CCACCTAC, TTATTTGT, ACAAATAA, 
GTAGGTGT, ACACCTAC, ATATTTGT, ACAAATAT, 

TGCGTGGGCGG, CCGCCCACGCA, TCGTTTACGTA, TACGTAAACGA, 
TGCGTGGGCGT, ACGCCCACGCA, ACGTTTACGTA, TACGTAAACGT, 

TGCGTAGGCGT, ACGCCTACGCA, ACGTTTACGTA, TACGTAAACGT, 
TGCGTAGGCGG, CCGCCTACGCA, TCGTTTACGTA, TACGTAAACGA, 
ATAGGAAGT, ACTTCCTAT, ATTTTTTGT, ACAAAAAAT, 
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TCGGAAGT, ACTTCCGA, ATTTTCGG, CCGAAAAT, 
TCGGAAGT, ACTTCCGA, GTTTTCGG, CCGAAAAC, 
TCGGAAAT, ATTTCCGA, ATTTTCGG, CCGAAAAT, 
TCGGAAAT, ATTTCCGA, GTTTTCGG, CCGAAAAC, 
GTAAATAA, TTATTTAC, TTGTTTAT, ATAAACAA, 
GTAAATAAATA, TATTTATTTAC, TGTTTATTTAT, ATAAATAAACA, 

AAAGTAAATA, TATTTACTTT, TGTTTATTTT, AAAATAAACA, 
AATGTAAATA, TATTTACATT, TGTTTATATT, AATATAAACA, 
TAAGTAAATA, TATTTACTTA, TGTTTATTTA, TAAATAAACA, 
TATGTAAATA, TATTTACATA, TGTTTATATA, TATATAAACA, 

ATAAATA, TATTTAT, TGTTTAT, ATAAACA, 
ATAAATA, TATTTAT, TATTTAT, ATAAATA, 
GATA, TATC, TATT, AATA, 

TAGATAA, TTATCTA, TTATTTG, CAAATAA, 
TTGATAA, TTATCAA, TTATTAG, CTAATAA, 
GATAA, TTATC, TTATT, AATAA, 

GATG, CATC, TATT, AATA, 

GATAG, CTATC, TTATT, AATAA, 
GATAAG, CTTATC, TTTATT, AATAAA, 

TGTTTATTTA, TAAATAAACA, TAAATAAATA, TATTTATTTA, 
TGTTTGTTTA, TAAACAAACA, TAAATAAATA, TATTTATTTA, 
TATTTATTTA, TAAATAAATA, TAAATAAATA, TATTTATTTA, 
TATTTGTTTA, TAAACAAATA, TAAATAAATA, TATTTATTTA, 

GTTAATGATT, AATC ATTAAC , AATTATTAAT, ATTAATAATT, 
GTTAATTATT, AATAATTAAC, AATAATTAAT, ATTAATTATT, 
GTTAATTAAT, ATTAATTAAC, ATT AATTAAT , ATTAATTAAT, 
GTTAATGAAT, ATTCATTAAC, ATTTATTAAT, ATTAATAAAT, 

TAAAGTTTA, TAAACTTTA, TGAATTTTG, CAAAATTCA, 
TAAAGGTTA, TAACCTTTA, TGATTTTTG, CAAAAATCA, 

AAAGTG AAATT , AATTTCACTTT, GGTTTTATTTT, AAAATAAAACC, 
AAAGCGAAATT, AATTTC G CTTT , GGTTTCGTTTT, AAAACGAAACC, 

TAGTTTT ATTTTTTT , AAAAAAAT AAAACTA , GGGAAAGTGAAATTG, 
CAATTTCACTTTCCC , 

TAGTTTT ATTTTTTT , AAAAAAATAAAACTA, GGAAAAGTGAAATTG, 
CAATTTC ACTTTTC C , 

TAGTTTTTTTTTTTT, AAAAAAAAAAAACTA, G GAAAAG AGAAATTG , 
CAATTTCTCTTTTCC, 
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TAGTTTTTTTTTTTT, AAAAAAAAAAAACTA, G G G AAAG AG AAATTG , 

CAATTTCTCTTTCCC, 

TAGGTG, CACCTA, TATTTG, CAAATA, 

TTTTAAAAATAATTTT, AAAATTATTTTTAAAA, AGGGTTATTTTTAGAG, 
CTCTAAAAATAACCCT, 

TTTTAAAAATAATTTT, AAAATTATTTTTAAAA, GGAGTTATTTTTAGAG, 
CTCTAAAAATAACTCC , 

TTTTAAAAATAATTTT, AAAATTATTTTTAAAA, AG AGTTATTTTTAG AG , 
CTCTAAAAATAACTCT, 

TTTTAAAAATAATTTT, AAAATTATTTTTAAAA, GGGGTTATTTTTAGAG, 
CTCTAAAAATAACCCC, 

TGTTATTAAAAATAG AAA , TTTCTATTTTTAATAAC A , 
TTTTTATTTTTAGTAATA, TATTACTAAAAATAAAAA, 
TGTTATTAAAAATAG AAT , ATTCTATTTTTAATAACA, 
GTTTTATTTTTAGTAATA, TATTACTAAAAATAAAAC, 
TTTGGTAT, ATACCAAA, GTGTTAAA, TTTAACAC 
GGGGA, TCCCC, TTTTT, AAAAA, 

TAGGGG, CCCCTA, TTTTTA, TAAAAA, 
GAGGGG, CCCCTC, TTTTTT, AAAAAA, 

TGTTG AGTTAT , ATAACTCAACA, ATGATTTAGTA, TACTAAATCAT, 
TGTTG ATTTAT , ATAAATCAACA, GTGAGTTAGTA, TACTAACTCAC, 
TGTTG AGTTAT, ATAACTCAACA, ATGATTTAGTA, TACTAAATCAT, 
TGTTG ATTTAT , ATAAATCAACA, GTGAGTTAGTA, TACTAACTCAC, 
GGGGATTTTT, AAAAATCCCC, GGGAATTTTT, AAAAATTCC C , 
GGGGATTTTT, AAAAATCCCC, GGGGATTTTT, AAAAATCCCC, 
GGGGATTTTT, AAAAATCCCC, GGAAATTTTT, AAAAATTTCC, 
GGGAATTTTT, AAAAATTCCC, GGAAATTTTT, AAAAATTTCC, 
GGGAATTTTT, AAAAATTCCC, GGAAATTTTT, AAAAATTTCC, 
GGGATTTTTT, AAAAAATCCC, GGAAAGTTTT, AAAACTTTCC, 
GGGAATTTTT, AAAAATTCCC, GGGAATTTTT, AAAAATTCCC, 
GGGATTTTTT, AAAAAATCCC, GGGAAGTTTT, AAAACTTCCC, 
GGGATTTTTTA, TAAAAAATCCC, TGGAAAGTTTT, AAAACTTTC C A , 
TTTAGTATTACGGATAGAGGT, ACCTCTATCCGTAATACTAAA, 
GTTTTTGTTCGTGGTGTTGAA, TTCAACACCACGAACAAAAAC, 
TTTAGTATTACGGATAGAGTT, AACTCTATCCGTAATACTAAA, 
GGTTTTGTTCGTGGTGTTGAA, TTC AAC AC C ACG AAC AAAAC C , 
TTTAGTATTACGGATAGCGTT, AACGCTATCCGTAATACTAAA, 
GGCGTTGTTCGTGGTGTTGAA, TTC AAC AC C AC G AAC AAC G C C , 
TTTAGTATTACGGATAGCGGT, ACCGCTATCCGTAATACTAAA, 
GTCGTTGTTCGTGGTGTTG AA, TTC AAC AC C AC G AAC AAC G AC , 

ATATGTAAAT, ATTTACATAT, ATTTGTATAT, ATATAC AAAT , 
TTATGTAAAT, ATTT AC ATAA , ATTTGTATAA, TTATAC AAAT , 



GAATATTTA, TAAATATTC, TG AAT ATTT, AAATATTCA, 
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GAATATGTA, TACATATTC, TGTATATTT, AAATATACA, 

ATAAT, ATTAT, ATTAT, ATAAT, 
GTAAT, ATTAC, ATTAT, ATAAT, 

AATGTAAAT, ATTTACATT, ATTTGTATT, AATACAAAT, 

ATTTGTATATT, AATATACAAAT, GGTATGTAAAT, ATTTAC ATACC , 
ATTTGTATATT, AATATACAAAT, AATATGTAAAT, ATTTACATATT, 
ATTTGTATATT, AATATACAAAT, AGTATGTAAAT, ATTTACATACT, 
ATTTGTATATT, AATATACAAAT, GATATGTAAAT, ATTTAC AT ATC , 

AGGAGT, ACTCCT, ATTTTT, AAAAAT, 
GGGAGT, ACTCCC, ATTTTT, AAAAAT, 

GGATATGTTCGGGTATGTTT, AAAC ATAC C C G AAC ATATC C , 
GGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCC, 
GGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCC, 
AGATATGTTCGGGTATGTTT, AAAC ATAC CCGAACATATCT, 
TCGTTTCGTTTTAGATAT, ATATCTAAAACGAAACGA, 
ATATTTAG AG C GG AACG G , CCGTTCCGCTCTAAATAT, 

CGTTACGGTT, AACCGTAACG, AATCGTGACG, CGTCACGATT, 
CGTTACGGTT, AACCGTAACG, GATCGTGACG, CGTCACGATC, 
CGTTACGTTT, AAAC GTAAC G , AAGCGTGACG, CGTCACGCTT, 
CGTTACGTTT, AAAC GTAAC G , GAGCGTGACG, CGTCACGCTC, 

TTTACGTATGA, TCATACGTAAA, TTATGCGTGAA, TTCACGCATAA, 
TTTAC GTTTG A , TCAAACGTAAA, TTAAGCGTGAA, TTCACGCTTAA, 
TTTAC GTTTTA , TAAAACGTAAA, TGAAGCGTGAA, TTCACGCTTCA, 
TTTAC GTATTA , TAATACGTAAA, TGATGCGTGAA, TTCACGCATCA, 

AATTAATTAA, TTAATTAATT, TTGATTGATT, AATCAATCAA, 
TATTAATTAA, TTAATT AAT A , TTGATTGATG, CATCAATCAA, 

TAATTAT, ATAATTA, ATGATTG, CAATCAT, 

TAGGTTA, TAACCTA, TGATTTA, TAAATCA, 

TTTTAAAT ATTTTT, AAAAAT ATTTAAAA, GGGGGTGTTTGGGG, 
CCCCAAACACCCCC 

TTTTAAATTATTTT, AAAATAATTTAAAA, GGGGTGGTTTGGGG, 
CCCCAAACCACCCC 

TTTT AAATTTTTTT , AAAAAAATTTAAAA, GGGGGGGTTTGGGG, 
CCCCAAACCCCCCC, 

TTTT AAAT AATTTT , AAAATTATTT AAAA , GGGGTTGTTTGGGG, 
CCCCAAACAACCCC, 



GAGGCGGGG, CCCCGCCTC, TTTCGTTTT, AAAACGAAA, 
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GAGGTAGGG, CCCTACCTC, TTTTGTTTT, AAAACAAAA, 
AAGGCGGGG, CCCCGCCTT, TTTCGTTTT, AAAACGAAA, 
AAGGTAGGG, CCCTACCTT, TTTTGTTTT, AAAACAAAA, 

GGGGGCGGGGT, ACCCCGCCCCC, ATTTCG Mill, AAAAAC G AAAT , 
GGGGGCGGGGT, ACCCCGCCCCC, GTTTCGTTTTT, AAAAAC G AAAC , 
TATTATTTTAT, ATAAAATAATA, GTGGGGTGATA, TATCACCCCAC, 
GATTATTTTAT, ATAAAATAATC, GTGGGGTGATT, AATCACCCCAC, 

ATTACGTGAT, ATCACGTAAT, ATTACGTGAT, ATCACGTAAT, 
ATTACGTGAT, ATCACGTAAT, GTTACGTGAT, ATC AC GTAAC , 

TTTTATATGG, CCATATAAAA, TTATATAAGG, CCTTATATAA, 
TTATATATGG, CCATATATAA, TTATATATGG, C CAT AT AT AA , 
AAATAAT, ATTATTT, GTTGTTT, AAACAAC, 
AAATTAA, TTAATTT, TTAGTTT, AAACTAA, 
AAATTAT, ATAATTT, GTAGTTT, AAACTAC, 
AAATAAA, TTTATTT, TTTGTTT, AAACAAA, 

ATTTTTCGGAAATG, C ATTTC C G AAAAAT , TATTTTCGGGAAAT, 
ATTTCCCGAAAATA, 

ATTTTTCGGAAATG, C ATTTC CG AAAAAT, TATTTTCGGGAAAT, 
ATTTCCCGAAAATA, 

ATTTTCGGGAAATG, CATTTCCCGAAAAT, TATTTTTCGGAAAT, 
ATTTCCGAAAAATA, 

ATTTTCGGGAAGTG, CACTTCCCGAAAAT, TATTTTTCGGAAAT, 
ATTTCCGAAAAATA, 

AATAG ATGTT , AACATCTATT, AATATTTGTT, AAC AAAT ATT, 
AATAGATGGT, ACCATCTATT, ATTATTTGTT, AACAAATAAT, 

GTATAAATA, TATTTATAC, TATTTATAT, ATATAAATA, 
GTATAAATG, CATTTATAC, TATTTATAT, ATATAAATA, 
GTATAAAAA, TTTTTATAC, TTTTTATAT, ATATAAAAA, 
GTATAAAAG, CTTTTATAC, TTTTTATAT, ATATAAAAA, 
TTATAAATA, TATTTATAA, TATTTATAG, CTATAAATA, 
TTATAAATG, CATTTATAA, TATTTATAG, CTATAAATA, 
TTATAAAAA, TTTTTATAA, TTTTTATAG, CTATAAAAA, 
TTATAAAAG, CTTTTATAA, TTTTTATAG, CTATAAAAA, 
GGGGGTTGACGTA, TACGTCAACCCCC, TGCGTTAATTTTT, 
AAAAATTAACGCA, 

GGGGGTTGACGTA, TACGTCAACCCCC, TACGTTAATTTTT, 
AAAAATTAACGTA, 

TGACGTATATTTTT, AAAAAT ATACGTCA, GGGGATATGCGTTA, 
TAACGCATATCCCC, 

TGACGTATATTTTT, AAAAAT ATACGTCA, GGGGGTATGCGTTA, 
TAACGCATACCCCC, 
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ATGATTTAGTA, TACTAAATCAT, TGTTGAGTTAT, ATAACTCAACA, 
GTTAT, ATAAC, ATGAT, ATCAT, 

TTACGTGA, TCACGTAA, TTACGTGG, CCACGTAA, 
TTACGTGG, CCACGTAA, TTACGTGG, CCACGTAA, 
TTACGTGG, CCACGTAA, TTACGTGA, TCACGTAA, 
TTACGTGA, TCACGTAA, TTACGTGA, TCACGTAA, 
GACGTT, AACGTC, AGCGTT, AACGCT, 

TGACGTGT, ACACGTCA, ATACGTTA, TAACGTAT, 
TGACGTGG, CCACGTCA, TTACGTTA, TAACGTAA, 

CGGTTATTTTG, CAAAATAACCG, TAAGATGGTCG Oder CGACCATCTTA 

enthalt, welche zu einer solchen DNA komplementar ist oder dieser entspricht, wie sie 
entstehen wurde, wenn ein ebenso langes DNA Fragment, welches uber seine 
Sequenz oder Sekundarstruktur die spezifische Lokalisierung von 
Genom/Chromatinabschnitten innerhalb des Zellkerns herbeifuhren kann, derart 
chemisch behandelt wurde, daG> an der 5'-Position unmethylierte Cytosinbasen in 
Uracil, Thymidin oder eine andere vom Hybridisierungsverhalten her dem Cytosin 
unahnliche Base verwandelt werden. 

In einer besonders bevorzugten Variante des Verfahrens enthalten die zur Amplifikation 
verwendeten Oligonukleotide aufier den oben definierten Konsensussequenzen 
mehrere Positionen, an denen entweder irgendeine der drei Basen G, A und T oder 
irgendeine der Basen C, A und T vorhanden sein kann. 

In einer besonders bevorzugten Variante des Verfahrens enthalten die zur Amplifikation 
verwendeten Oligonukleotide aufter einer der oben beschriebenen Konsensus- 
sequenzen nur maximal zusatzlich so viele weitere Basen, wie es zur gleichzeitigen 
Amplifikation von mehr als einhundert verschiedenen Fragmenten pro Reaktion aus der 
chemisch wie oben behandelten DNA erforderlich ist. 

In einem dritten Verfahrensschritt wird nun der Sequenzkontext alier oder eines Teils 
der in den amplifizierten Fragmenten enthaltenen CpG Dinukleotide oder CpNpG 
Trinukleotide untersucht. 
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In einer besonders bevorzugten Variante des Verfahrens erfolgt die Analyse durch 
Hybridisierung der bereits in der Amplifikation mit einem Fluoreszenzmarker 
versehenen Fragmente an einen Oligonukleotid- Array (DNA Chip). Der 
Fluoreszenzmarker kann entweder uber die verwendeten Primer oder aber durch ein 
fluoreszenzmarkiertes Nukleotid (z. B. Cy5-dCTP, kommerziell von Amersham- 
Pharmacia erhaltlich) eingefuhrt werden. 

Dabei hybridisieren komplementare Fragmente an die jeweiligen auf der 
Chipoberflache immobilisierten Oligomere, nicht komplementare Fragmente werden in 
einem oder mehreren Waschschritten entfernt. Die Fluoreszenz an den jeweiligen 
Hybridisierungsorten auf dem Chip erlaubt dann den Riickschlufc auf den 
Sequenzkontext der in den amplifizierten Fragmenten enthaltenen CpG Dinukleotide 
oder CpNpG Trinukleotide. 

In einer weiteren bevorzugten Variante des Verfahrens werden die amplifizierten 
Fragmente auf einer Oberflache immobilisiert und anschlie&end eine Hybridisierung mit 
einer kombinatorischen Bibiliothek von unterscheidbaren Oligonukleotid- oder PNA- 
Oligomer-Sonden durchgefuhrt. Wiederum werden nicht komplementare Sonden durch 
einen oder mehrere Waschschritte entfernt. Die hybridisierten Sonden werden 
entweder uber ihre Fluoreszenzmarker detektiert oder in einer weiteren besonders 
bevorzugten Variante des Verfahrens mittels Matrix-assistierter Laser- 
Desorptions/lonisations Massenspektrometrie (MALDI-MS) anhand ihrer eindeutigen 
Masse nachgewiesen. Dabei werden die Sondenbibliotheken derart synthetisiert, daG> 
die Masse eines jeden Bestandteils eindeutig seiner Sequenz zugeordnet werden kann. 

Die Amplifikate konnen zudem in einer weiteren bevorzugten Variante des Verfahrens 
hinsichtlich Ihrer durchschnittlichen GroSe durch Veranderung der 
Kettenverlangerungszeiten im Amplifikationsschritt beeinfluBt werden. Da hier 
vorwiegend kleinere Fragmente (ca. 200-500 Basenpaare) untersucht werden, ist eine 
Verkurzung der Kettenverlangerungsschritte z. B. einer PCR sinnvoll. 

In einer weiteren bevorzugten Variante des Verfahrens werden die Amplifikate durch 
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Gelelektrophorese aufgetrennt, und die Fragmente im gewunschten GroRenbereich 
werden vor Ihrer Analyse ausgeschnitten. In einer weiteren besonders bevorzugten 
Variante werden die aus dem Gel ausgeschnittenen Amplifikate unter Verwendung des 
gleichen Satzes an Primern erneut amplifiziert. Dabei konnen dann nur noch 
Fragmente der gewunschten GroBe entstehen, da Andere als Templat nicht mehr 
verfugbar sind. 

Ein weiterer Gegenstand der vorleigenden Erfindung ist ein Kit, enthaltend mindestens 
zwei Primerpaare, Reagenzien und Hilfsstoffe fur die Amplifikation und/oder 
Reagenzien und Hilfsmittel fur die chemische Behandlung und/oder eine 
kombinatorische Sondenbibliothek und/oder einen Oligonukleotid-Array (DNA-Chip), 
soweit sie fur die Durchfiihrung des erfindungsgemaBen Verfahrens erforderlich oder 
dienlich sind. 

Die folgenden Beispiele erlautern die Erfindung. 

Beispiele: 
Beispiel 1 : 

Primer zur bevorzugten Amplifikation von CG reichen Regionen im Humangenom 

Bei den CG reichen Regionen im Humangenom handelt es sich um sogenannte CpG- 
islands, die eine regulatorischen Funktion besitzen. Wir definieren CpG Islands derart, 
dass sie mindestens 500 bp umfassen sowie einen GC-Gehalt von >50% aufweisen , 
ausserdem ist der Quotient CG/GC > 0,6. Unter diesen Bedingungen liegen 16 Mb als 
CpG Islands vor. Damit liegen etwa 0,5 % der Genomsequenz in diesen CpG islands, 
wenn man auch noch jeweils eine Region bis 1000 bp downstream zusatzlich 
betrachtet. Dieser Uberlegung liegen Daten aus der Ensembl Database vom 31.10.00, 
Quelle Sanger Centre, zugrunde. Die dort verfugbare Sequenz umfasste ca. 3,5 GB, 
und fur die Berechnungen wurden die Repeats maskiert. 

Statistisch ware es bei 12meren zu erwarten, dass sie nur 0,005 mal so haufig an eine 
der CG-reichen Regionen hybridisieren wie an eine andere beliebige Region im 



WO 01/42493 



27 



PCT7DE00/04381 



Genom. Es wurden nun Primer gefunden, welche 1,8 mal haufiger an eine CG reiche 
Region binden. Zudem ergibt sich mit den entsprechend gefundene Reverse Primer 
nahezu eine Spezifitat fur diese CpG islands. 

In diesem Beispiel sind die Primer AGTAGTAGTAGT (Seq. ID 1) AAAACAAAAACC 
(Seq. ID 2) und alternativ AGTAGTAGTAGT (Seq. ID 19) und ACAAAAACTAAA (seq. 
ID 20). Das erste Primerpaar fuhrt mindestens zu den Amplifikaten Seq. ID 3 bis 18, 
das zweite Primerpaar zu den Amplifikaten der Seq. ID 21 bis 31. 



Beispiel 2: 

Berechnung der Vorhersage der Anzahl von Amplifikaten in Genomischen Regionen. 

Gemali Anspruch 8 im Patent wird gezeigt mehr als doppelt so viele Amplifikate 
erstellen zu konnen, als es statistisch zu erwarten ware nach Formel 1. 

F=N*P s (Primers) } [^""l^ x M -P a (Prtmers)) u -l] 
\og{\-P a {Primers)y 

(P (Primers)) Formel 1. 

+ " lc 8(1 -P, iPr Zs)) ^-nPrimersr - 1 ] 



F gibt dabei die Anzahl der Vorhergesagten Amplifikate an, die zu erwarten sind, wenn 
man N Basen als Datenbasis aus dem Genom betrachtet. P ist die jeweilige 
Wahrscheinlichkeit fur die Hybridisierung eines Primeroligonukleotids, getrennt nach 
Hybridisierung im Sense- und Antisense-Strang. M ist die maximal zulassige Lange der 
zu erwartenden Amplifikate. 



Die Wahrscheinlichkeit P wird bestimmt durch eine Markov Kette erster Ordnung. Dabei 
wird die Annahme gemacht, dass die DNA eine Zufallsfolge in Abhangigkeit 
benachbarter Basen ist. Fur die Berechnung einer Markovkette sind die 
Obergangswahrscheinlichkeiten von benachbarten Basen notwendig. Diese wurden 
empirisch aus 12% des assemblierten humanen Genoms, das vollstandig mit Bisulfit 
behandelt wurde, ermittelt und in Tabelle 1 zusammengefasst. In Tabelle 2 sind die 
Obergangswahrscheinlichkeiten fur den entsprechenden komplementar reversen 
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Strang angegeben. Diese ergeben sich durch einfaches Vertauschen der Eintrage aus 
der Tabelle 1 . 



Tabelle 1 



Von\nach 


A 


C 


G 


7 


A 


0.0894 


0.0033 


0.0722 


0.1162 


C 


0.0 


0.0 


0.0140 


0.0 


G 


0.0603 


0.0036 


0.0601 


0.0959 


T 


0.1314 


0.0071 


0.0736 


0.2729 



mit 

P AOAM U)=0.2811 

iWC)=0.0140 
P bDNA (G)=0.2\99 
iWn=0.4850 

und fur den dazu revers-komplementaren Strang (durch entsprechendes Austauschen 
der Eintrage) P^dna ( von •' nach ) 



Tabelle 2 



Von\nach 


A 


C 


G 


T 


A 


0.2729 


0.0959 


0.0 


0.1162 


C 


0.0736 


0.0601 


0.0140 


0.0722 


G 


0.0071 


0.0036 


0.0 


0.0033 


T 


0.1314 


0.0603 


0.0 


0.0894 



^ O ^(^)=0.4850 
P rbDNA (C)=0.2199 
P rbDNA (G)=0M40 
^Wn=0.2811 

Damit hangt die Wahrscheinlichkeit, dass sich fur einen Primer PrimE (mit der 
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Basenfolge Bi B 2 B 3 B 4 z.B. ATTG...) eine perfekte Basenpaarung ergibt, von der 

genauen Abfolge der Basen ab und ergibt sich als das Produkt: 

d ( d • i7\ r> / n \PrbDNA(Bt; B 2 ) P r t, DNA {B 2 ; P rbDNA (B 3 ; B 4 ) 
F 3s { Fnmh ) - F rbDNA (B } ) — -— — -— — . . . 

rbDNA \ -° 1 / r rbDNA\ D 2) rbDNA v -° 3 / 

(Bisulfit-DNA-Strang) 

P l Pri™J7\- P ( P \ P bDN A ( B \; B l) P bDNA( B 2>' B 3) P bDN A ( B 2 ^ B a) 

P 3a {PrimE)-P bDNA (B x )—~ — — j—— ... 

r bDNA \**\) f bDNA\ B 2) ^ bDNA\ B 3) 

(anti-sense-Strang zu einem Bisulfit-DNA-Strang); 
fur einen Primer Prim auf dem sense-Strang ergeben sich 

N*P s (Prim) 

perfekte Basenpaarungen - Werden mehrere Primer (PrimU, PrimV, PrimW, PrimX, 
etc.) gleichzeitig verwendet, ergibt sich als Wahrscheinlichkeit fur eine perfekte 
Basenpaarung auf dem sense-Strang an einer gegebenen Position: 

P s ( Primers )=P S { Prim U ) 

+ (\-P s {PrimU))P s {PrimV) 
+ {\-P s {PrimU)){\-P s {PrimV))P s {PrimW) 
+ {\-P^PrimU)){\-P^PrimV)){\-PXPrimW 
+ ... 

(PrimU, PrimV, PrimW... sind hier verschiedene Primer mit unterschiedlichen 
Basenpaarungen) 

und damit als Anzahl der zu erwartenden perfekten Basenpaarungen mit irgendeinem 
der Primer 

N *P s {Primers) . 

Fur die Bestimmung von P a (Primers) auf dem anti-sense-Strang werden die analogen 
Gleichungen verwendet. 

Fur das Beispiel mit zwei Primern (einem sense-Primer und einem antisense-Primer) 
ergeben sich folgende Wahrscheinlichkeiten: 
P(AGTAGTAGTAGT) = 0.000000860027 
P ( AAC AAAAACTAA) = 0.000030005828 

Auf den CpG-lslands, die insgesamt ca. 30.000.000 Basen enthalten, erwartet man 
eine Haufigkeit von Hybridisierungen fur: 
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AGTAGTAGTAGT: 25.80 auf dem sense Strang 

AACAAAAACTAA: 900.17 auf dem komplementar reversen Strang. 

Auf den jeweils anderen Strangen konnen die Primer nicht hybridisieren, da auf dem 

sense-Strang durch die Bisulfitbehandlung keine Cs aulierhalb des Kontextes CG 

auftreten und entsprechend komplementar auf dem antisense-Strang. 



Ein Amplifikat entsteht genau dann, wenn bei einer perfekten Basenpaarung auf dem 
sense-Strang innerhalb der maximalen Fragmentlange M ein Primer auf dem 
Gegenstrang eine perfekte Basenpaarung bildet, die Wahrscheinlichkeit dafur ist 

P a (Primers)^[ Q 2 ( 1 -P a {Primers)) 1 ; 

fur grolie M und kleine P a (Primers) wird dieses durch folgenden Ausdruck berechnet: 

P a {Primers) . M 



■[{\-P a {Primers)r -\] 



log ( 1 — P a {Primers)) 

fur die Gesamtzahl F der Amplifikate, die durch die Amplifikation beider Strange zu 

erwarten sind, ergibt sich damit 

(P n {Primers)) r/ , uW n 

F=N *P s {Primers)- — rr^TTT, 1 ~ P a {Primers)) M - 1 

} \og{\-P a {Primers)r Formel 1 

{P JPrimers)) r/ , 

+ N .P. IM-I ^^ Ki-^ )) 

Fur das oben angegebene Beispiel ergeben sich fur die CpG-lslands mit 30 Mega 
Basen 3.0498 Amplifikate. Wir konnen jedoch zeigen (siehe Beispiel 1), dass man mit 
Primern, die fur bestimmte Regionen spezifisch sind, mehr als statistisch vorhergesagte 
Amplifikate erzeugen kann. 



WO 01/42493 



31 



PCTYDEOO/04381 



Patentanspruche 

1. Verfahren zur parallelen Detektion des Methylierungszustandes von genomischer 
DNA, dadurch gekennzeichnet, date man folgende Schritte ausfuhrt: 

a) in einer genomischen DNA Probe wandelt man durch chemische Behandlung an 
der 5'-Position unmethylierte Cytosinbasen in Uracil, Thymidin oder eine andere vom 
Hybridisierungsverhalten herdem Cytosin unahnliche Base um; 

b) aus dieser chemisch behandelten genomischen DNA amplifiziert man mehr als 
zehn unterschiedliche Fragmente, die jeweiis weniger als 2000 Basenpaare lang 
sind, gleichzeitig durch Verwendung von synthetischen Oiigonukleotiden als Primer, 
wobei diese Primer jeweiis Sequenzen aus an der Genregulation beteiligten 
und/oder transkribierten und/oder translatierten genomischen Sequenzen enthalten, 
wie sie nach einer Behandlung gemaS Schritt a) vorliegen wurden; 

c) man bestimmt den Sequenzkontext aller oder eines Teils der in den amplifizierten 
Fragmenten enthaltenen CpG Dinukleotide oder CpNpG Trinukleotide. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daft man die chemische 
Behandlung mitteis einer Losung eines Bisulfits, Hydrogensulfits oder Disulfits 
durchfuhrt. 

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daB mindestens eines 
der in Schritt b) verwendeten Oligonukleotide weniger Nukleobasen enthalt als es 
statistisch fur eine sequenzspezifische Hybridisierung an die chemisch behandelte 
genomische DNA Probe erforderlich ware. 

4. Verfahren nach einem der Anspruche 1 bis 3, dadurch gekennzeichnet, daft 
mindestens eines der in Schritt b) des Anspruchs 1 verwendeten Oligonukleotide 
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kurzerals 18 Nukleobasen ist. 



5. Verfahren nach einem der Anspruche 1 bis 3, dadurch gekennzeichnet, da(3> 
mindestens eines der in Schritt b) des Anspruchs 1 verwendeten Oligonukleotide 
kurzer als 15 Nukleobasen ist. 



6. Verfahren nach Anspruch 1 Oder 2, dadurch gekennzeichnet, date man in Schritt b) 
des Anspruchs 1 mehr als 4 verschiedene Oligonukleotide gleichzeitig fur die 
Amplifikation verwendet. 

7. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daft man in Schritt b) 
des Anspruchs 1 mehr als 26 verschiedene Oligonukleotide gleichzeitig fur die 
Amplifikation verwendet. 

8. Verfahren nach einem der vorangehenden Anspruche, dadurch gekennzeichnet, daft 
in Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als 
nach berechnet nach Formel 1 aus an der Regulation von Genen beteiligten 
Genomabschnitten, wie Promotoren und Enhancern, stammt, als bei einer rein 
zufalligen Wahl der Oligonukleotidsequenzen zu erwarten ware, oder aber deren 
Anteil an den insgesamt nachweisbaren Fragmenten mehr als doppelt so hoch ist 
wie berechnet nach Formel 1, 



F - K * p - { ^ ) ^-^^)) i{i -^ Mm)r - i] Formel , 

( P { Primers ) i 

+ N*P a (Primers)- — „ /n . ; J O ~P s (Primers)) M -1} 



wobei man die Berechnung wie folgt durchfuhrt: 



bei der mit Bisulfit behandelten DNA kann C nur noch im Kontext CG auftreten, 
so wird angenommen, daft die primare DNA eine Zufallsfolge mit Abhangigkeit 
direkt benachbarter Basen ist (Markov-Kette erster Ordnung); die empirisch aus 
der Datenbank (vollstandig methyliert; mit Bisullfit behandelt) ermittelten 
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paarweisen Basenwahrscheinlichkeiten ergeben sich gleich fur beide DNA- 
Strange als P bDNA {von;nach) aus der folgenden Tabelle: 



Von\nach 


A 


C 


G 


T 


A 


0.0894 


0.0033 


0.0722 


0.1162 


C 


0.0 


0.0 


0.0140 


0.0 


G 


0.0603 


0.0036 


0.0601 


0.0959 


T 


0.1314 


0.0071 


0.0736 


0.2729 



mit 



iW^)=0.2811 

^WC)=0.0140 
P bDNA {G)=Q.2\99 
^Wn=0.4850 



und for den dazu revers-komplementaren Strang (durch entsprechendes 
Austauschen der Eintrage) P rbDN A ( von >' nach) 



VonXnach 


A 


C 


G 


T 


A 


0.2729 


0.0959 


0.0 


0.1162 


C 


0.0736 


0.0601 


0.0140 


0.0722 


G 


0.0071 


0.0036 


0.0 


0.0033 


T 


0.1314 


0.0603 


0.0 


0.0894 



P rbDNA U)=0AS50 
P rbDNA (C)=0.2199 
P rbDNA (G)=0M40 
P rbDNA (T)=0.2Sll 

;damit hangt die Wahrscheinlichkeit, daS sich fur einen Primer PrimE (mit der 
Basenfolge Bi B 2 B 3 B 4 z.B. ATTG...) eine perfekte Basenpaarung ergibt, von 
der genauen Abfolge der Basen ab und ergibt sich als das Produkt: 
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r> fp..™Z7\_p ( P \ PrbDNA(B\ >_ B l) ? ' rbDNA *2 ' & 3) P rbDNA (^3 >' B 4) 

r s\rrimt)—F rbDNA {B x ) — — — - — . . . 

r rbDNA\ n \) r rbDNA\ n l) r rbDNA\ n 3J 

(Bisulfit-DNA-Strang) 

p (Pri™i7\—P ( p ^ ^bPNA [B\ > 87) PbDNA^ 2 ; B 3 ) P bDNA (B 2 ; B 4 ) 
r 3a \ rrima ) - r bDNA [& } ) - — - - -— ... 

r bDNA\^\) r bDNA\^2) " bDNA \ **3/ 

(anti-sense-Strang zu einem Bisulfit-DNA-Strang); 

fur einen Primer Prim auf dem sense-Strang ergeben sich 

N*P s {Prim) ; 

perfekte Basenpaarungen - Werden mehrere Primer (PrimU, PrimV, PrimW, 
PrimX, etc.) gleichzeitig verwendet, ergibt sich als Wahrscheinlichkeit fur eine 
perfekte Basenpaarung auf dem sense-Strang an einer gegebenen Position: 

P s ( Primers )=P g ( Prim U ) 

+ (\-P s (PrimU))P s (PrimV) 

Hl-P s {PrimU))(l-P g (PrimV))P s (PrimW) 

+(1-P \{PrimU)){\-P s {PrimV)){\-P s {PrimW))P M (PrimX) 

+ ... 

und damit als Anzahl der zu erwartenden perfekten Basenparungen mit 
irgendeinem der Primer 

N *P s (Primers) ; 

fur die Bestimmung von P a (Primers) auf dem anti-sense-Strang werden die 
analogen Gleichungen verwendet; ein Amplifikat entsteht genau dann, wenn bei 
einer perfekten Basenpaarung auf dem sense-Strang innerhalb der maximalen 
Fragmentlange M ein Primer auf dem Gegenstrang eine perfekte Basenpaarung 
bildet, die Wahrscheinlichkeit dafur ist 

P a {Primers) X, =0 {\-P a {Primers)) ! ■ 

fur grofce M und kleine P a (Primers) wird dieses durch folgenden Ausdruck 
berechnet: 

P a {Primers) , „„,_„__^ 



Xo t{i -P«(P rim ers)) [(X - P - {PHmers)) - 11 1 
fur die Gesamtzahl Fder Amplifikate, die durch die Amplifikation beider Strange 
zu erwarten sind, ergibt sich damit 
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F= N *P X ( Primers ) 



{P a (Primers)) 



[(l~P a (Primers)) M -1] 



+N *P a (Primers) 



log ( 1 —P a (Primers)) 
(P .(Primers)) 



[(\-P x (Primers)) M -l] 



Formel 1 



log ( 1 - / > i ( Primers ) ) 



9. Verfahren nach einem der Anspruche 1 bis 7, dadurch gekennzeich.net, daE in 
Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als 
berechnet entsprechend Anspruch 8 aus Genomabschnitten stammt, die in 
mindestens einer Zelle des jeweiligen Organismus in mRNA transkribiert werden, als 
bei einer rein zufalligen Wahl der Oligonukieotidsequenzen zu erwarten ware, oder 
aber deren Anteil an den insgesamt nachweisbaren Fragmenten mehr als doppelt so 
hoch ist als berechnet entsprechend Anspruch 8. 

10-Verfahren nach einem der Anspruche 1 bis 7, dadurch gekennzeichnet, daG, in 
Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als 
berechnet entsprechend Anspruch 8 aus nach der Transkription in mRNA 
gespiiceten Genomabschnitten (Exons) stammt, als bei einer rein zufalligen Wahl 
der Oligonukieotidsequenzen zu erwarten ware, oder aber deren Anteil an den 
insgesamt nachweisbaren Fragmenten mehr als doppelt so hoch ist als berechnet 
entsprechend Anspruch 8. 

11. Verfahren nach einem der Anspruche 1 bis 7, dadurch gekennzeichnet, daG, in 
Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als 
berechnet entsprechend Anspruch 8 aus Genomabschnitten stammen, welche fur 
Teile einer oder mehrerer Genfamilien kodieren, als bei einer rein zufalligen Wahl 
der Oligonukieotidsequenzen zu erwarten ware, oder aber deren Anteil an den 
insgesamt nachweisbaren Fragmenten mehr als doppelt so hoch ist als berechnet 
entsprechend Anspruch 8. 

12. Verfahren nach einem der Anspruche 1 bis 7, dadurch gekennzeichnet, daG in 
Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als 
berechnet entsprechend Anspruch 8. aus Genomabschnitten stammen, welche fur 
sogenannte „matrix attachment sites" (MARs)- charakteristische Sequenzen 
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enthalten, als bei einer rein zufalligen Wahl der Oligonukleotidsequenzen zu 
erwarten ware, Oder aber deren Anteil an den insgesamt nachweisbaren Fragmenten 
mehr als doppelt so hoch ist als berechnet entsprechend Anspruch 8. 

13. Verfahren nach einem der Anspruche 1 bis 7, dadurch gekennzeichnet, dal3> in 
Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als 
berechnet entsprechend Anspruch 8 aus Genomabschnitten stammen, welche als 
sogenannte ..boundary elements" die Verpackungsdichte des Chromatins 
organisieren, als bei einer rein zufalligen Wahl der Oligonukleotidsequenzen zu 
erwarten ware, oder aber deren Anteil an den insgesamt nachweisbaren Fragmenten 
mehr als doppelt so hoch ist als berechnet entsprechend Anspruch 8. 

14. Verfahren nach einem der Anspruche 1 bis 7, dadurch gekennzeichnet, daG in 
Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als 
berechnet entsprechend Anspruch 8 aus „multiple drug resistance gene" (MDR)- 
Promotoren oder kodierenden Regionen stammen, als bei einer rein zufalligen Wahl 
der Oligonukleotidsequenzen zu erwarten ware oder aber deren Anteil an den 
insgesamt nachweisbaren Fragmenten mehr als doppelt so hoch ist als berechnet 
entsprechend Anspruch 8. 

15. Verfahren nach einem der vorangehenden Anspruche, dadurch gekennzeichnet, 
daB zur Amplifkation der in Anspruch 1 beschriebenen Fragmente zwei 
Oligonukleotide oder zwei Klassen von Oligonukleotiden verwendet werden, von 
denen eines oder eine Klasse aufcer im Kontext CpG oder CpNpG zwar die Base C 
enthalten kann, nicht aber die Base G und von denen das andere oder die andere 
Klasse au&er im Kontext CpG oder CpNpG zwar die Base G, nicht aber die Base C 
enthalten kann. 

16. Verfahren nach einem der Anspruche 1 bis 4, dadurch gekennzeichnet, daR die in 
Anspruch 1 beschriebene Amplifikation mittels zweier Oligonukleotide durchgefuhrt 
wird, von denen eines eine vier bis sechzehn Basen lange Sequenz enthalt, welche 
zu einer solchen DNA komplementar ist oder dieser entspricht, wie sie entstehen 
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wiirde, wenn ein ebenso langes DNA Fragment, an welches einer der 
Transkriptionsfaktoren 



AhR/Amt 

Arnt 
AML-1a 

AP-1 

C/EBP 

C/EBPalpha 

C/EBPbeta 

CDP 

CDP 

CDP CR1 
CDP CR3 

CHOP-C/EBPalpha 

c-Myc/Max 

CREB 
CRE-BP1 



CRE-BP1/c-Jun 

CREB 

E2F 



E47 

E47 

Egr-1 
Egr-2 
ELK-1 

Freac-2 

Freac-3 

Freac-4 

Freac-7 



aryl hydrocarbon receptor/aryl hydrocarbon receptor nuclear 
translocator 

aryl hydrocarbon receptor nuclear translocator 
CBFA2; core-binding factor, runt domain, alpha subunit 2 
(acute myeloid leukemia 1; amh oncogene) 
activator protein-1 (AP-1); Synonyme: c-Jun 
CCAAT/enhancer binding protein 
CCAAT/enhancer binding protein (C/EBP), alpha 
CCAAT/enhancer binding protein (C/EBP), beta 
CUTL1; cut (Drosophila)-like 1 (CCAAT displacement 
protein) 

CUTL1; cut (Drosophila)-like 1 (CCAAT displacement 
protein) 

complement component (3b/4b) receptor 1 

complement component (3b/4b) receptor 3 

DDIT; DNA-damage-inducible transcript 3/CCAAT/enhancer 

binding protein (C/EBP), alpha 

avian myelocytomatosis viral oncogene/MYC-ASSOCIATED 
FACTOR X 

cAMP responsive element binding protein 
CYCLIC AMP RESPONSE ELEMENT-BINDING PROTEIN 
2, CREB2, CREBP1; now ATF2; activating transcription 
factor 2 

activator protein-1 (AP-1); Synonyme: c-Jun 

MP responsive element binding protein 

E2F transcription factor (originally identified as a DNA- 

binding protein essential E1A-dependent activation of the 

adenovirus E2 promoter) 

transcription factor 3 (E2A immunoglobulin enhancer binding 
factors E12/E47) 

transcription factor 3 (E2A immunoglobulin enhancer binding 

factors E12/E47) 

early growth response 1 

early growth response 2 (Krox-20 (Drosophila) homolog) 
ELK1, member of ETS (environmental tobacco smoke) 
oncogene family 

FKHL6; forkhead (Drosophila)-like 6; FORKHEAD-RELATED 
ACTIVATOR 2; FREAC2 

FKHL7; forkhead (Drosophila)-like 7; FORKHEAD-RELATED 
ACTIVATOR 3; FREAC3 

FKHL8; forkhead (Drosophila)-like 8; FORKHEAD-RELATED 
ACTIVATOR 4; FREAC4 

FKHL1 1 ; forkhead (Drosophila)-like 9; FORKHEAD- 
RELATED ACTIVATOR 7; FREAC7 
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GATA-1 GATA-binding protein 1/Enhancer-Binding Protein GATA1 

GATA-1 GATA-binding protein 1/Enhancer-Binding Protein GATA1 

GATA-1 GATA-binding protein 1/Enhancer-Binding Protein GATA1 

GATA-2 GATA-binding protein 2/Enhancer-Binding Protein GATA2 

GATA-3 GATA-binding protein 3/Enhancer-Binding Protein GATA3 

GATA-X 

HFH-3 FKHL10; forkhead (Drosophila)-like 10; FORKHEAD- 

RELATED ACTIVATOR 6; FREAC6 

HNF-1 TCF1; transcription factor 1, hepatic; LF-B1, hepatic nuclear 

factor (HNF1), albumin proximal factor 

HNF-4 hepatocyte nuclear factor 4 

IRF-1 interferon regulatory factor 1 

ISRE interferon-stimulated response element 

Lmo2 complex LIM domain only 2 (rhombotin-like 1) 

MEF-2 MADS box transcription enhancer factor 2, polypeptide A 

(myocyte enhancer factor 2A) 

MEF-2 MADS box transcription enhancer factor 2, polypeptide A 

(myocyte enhancer factor 2A) 

myogenin/NF-1 Myogenin (myogenic factor 4)/Neurofibromin 1 ; 

NEUROFIBROMATOSIS, TYPE I 

MZF1 ZNF42; zinc finger protein 42 (myeloid-specific retinoic acid- 

responsive) 

MZF1 ZNF42; zinc finger protein 42 (myeloid-specific retinoic acid- 

responsive) 

NF-E2 NFE2; nuclear factor (erythroid-derived 2), 45kD 

NF-kappaB (p50) nuclear factor of kappa light polypeptide gene enhancer in B- 

cells p50 subunit 

NF-kappaB (p65) nuclear factor of kappa light polypeptide gene enhancer in B- 

cells p65 subunit 

NF-kappaB nuclear factor of kappa light polypeptide gene enhancer in B- 

cells 

NF-kappaB nuclear factor of kappa light polypeptide gene enhancer in B- 

cells 

NRSF NEURON RESTRICTIVE SILENCER FACTOR; REST; RE1- 

silencing transcription factor 
Oct-1 OCTAMER-BINDING TRANSCRIPTION FACTOR 1 ; 

POU2F1; POU domain, class 2, transcription factor 1 
Oct-1 OCTAMER-BINDING TRANSCRIPTION FACTOR 1 ; 

POU2F1; POU domain, class 2, transcription factor 1 
Oct-1 OCTAMER-BINDING TRANSCRIPTION FACTOR 1 ; 

POU2F1; POU domain, class 2, transcription factor 1 
Oct-1 OCTAMER-BINDING TRANSCRIPTION FACTOR 1 ; 

POU2F1; POU domain, class 2, transcription factor 1 
Oct-1 OCTAMER-BINDING TRANSCRIPTION FACTOR 1 ; 

POU2F1; POU domain, class 2, transcription factor 1 
P300 E1A (adenovirus E1 A oncoprotein)-BINDING PROTEIN, 

300-KD 

P53 tumor protein p53 (Li-Fraumeni syndrome); TP53 
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Pax-1 
Pax-3 
Pax-6 
Pbx 1b 
Pbx-1 

RORalpha2 

RREB-1 

SP1 

SP1 

SREBP-1 
SRF 

SRY 
STAT3 

Tal-1alpha/E47 

TATA 
Tax/CREB 

Tax/CREB 

TCF1 1/MafG 

TCF11 

USF 
Whn 
X-BP-1 
YY1 



paired box gene 1 

paired box gene 3 (Waardenburg syndrome 1) 

paired box gene 6 (aniridia, keratitis) 

pre-B-cell leukemia transcription factor 

pre-B-cell leukemia transcription factor 1 

RAR-RELATED ORPHAN RECEPTOR ALPHA; RETINOIC 

ACID-BINDING RECEPTOR ALPHA 

ras responsive element binding protein 1 

simian-virus-40-protein-1 

simian-virus-40-protein-1 

sterol regulatory element binding transcription factor 1 
serum response factor (c-fos serum response element- 
binding transcription factor) 
sex determining region Y 

signal transducer and activator of transcription 1, 91 kD 
T-cell acute lymphocytic leukemia 1 /transcription factor 3 
(E2A immunoglobulin enhancer binding factors E12/E47) 
cellular and viral TATA box elements 

Transiently-expressed axonal glycoprotein/cAMP responsive 
element binding protein 

Transiently-expressed axonal glycoprotein/cAMP responsive 
element binding protein 

v-maf musculoaponeurotic fibrosarcoma (avian) oncogene 
family, protein G 

Transcription Factor 11; TCF11; NFE2L1; nuclear factor 

(erythroid-derived 2)-like 1 

upstream stimulating factor 

winged-helix nude 

X-box binding protein 1 oder 

ubiquitously distributed transcription factor belonging to 
theGLI-Kruppel class of zinc finger proteins 



bindet, einer chemischen Behandlung gema(3> Anspruch 1 unterzogen wurde. 

17.Verfahren nach einem der Anspruche 1 bis 4, dadurch gekennzeichnet, da(2> man 
die in Anspruch 1 beschriebene Amplifikation mittels zweier Oligonukleotide 
durchfuhrt, von denen eines die eine vier bis sechzehn Basen lange Sequenz 
enthalt, welche zu einer solchen DNA komplementar ist oder dieser entspricht, wie 
sie entstehen wurde, wenn ein ebenso langes DNA Fragment, welches uber seine 
Sequenz oder Sekundarstruktur die spezifische Lokalisierung von 
Genom/Chromatinabschnitten innerhalb des Zellkerns herbeifuhren kann, einer 
chemischen Behandlung gemaR Anspruch 1 unterzogen wurde. 
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18.Verfahren nach einem der Anspriiche 1 bis 4, dadurch gekennzeichnet, dal3> die in 
Anspruch 1 beschriebene Amplifikation mittels zweier Oligonukleotide durchgefuhrt 
wird, von denen mindestens eine der Sequenzen (von 5'nach 3') 



TCGCGTGTA, TACACGCGA, TGTACGCGA, TCGCGTACA, 
TTGCGTGTT, AACACGCAA, GGTACGTAA, TTACGTACC, 
TCGCGTGTT, AACACGCGA, GGTACGCGA, TCGCGTACC, 
TTGCGTGTA, TACACGCAA, TGTACGTAA, TTACGTACA, 
TACGTG, CACGTA, TACGTG, CACGTA, 

ATTGCGTGT, ACACGCAAT, GTACGTAAT, ATTACGTAC, 
ATTGCGTGA, TCACGCAAT, TTACGTAAT, ATTACGTAA, 
ATCGCGTGA, TCACGCGAT, TTACGCGAT, ATCGCGTAA, 
ATCGCGTGT, ACACGCGAT, GTACGCGAT, ATCGCGTAC, 
TGTGGT, ACCACA, ATTATA, TATAAT, 

TGAGTTAG, CTAACTCA, TTGATTTA, TAAATCAA, 
TGATTTAG, CTAAATCA, TTGAGTTA, TAACTCAA, 

TTTGGT, ACCAAA, ATT AAA, TTTAAT, 
TGTGGA, TCCACA, TTTATA, TATAAA , 
TTTGGA, TCCAAA, TTTAAA, TTTAAA, 
TGTGGT, ACCACA, ATTATA, TATAAT, 

ATTAT, ATAAT, GTAAT, ATTAC, 
ATTGT, ACAAT, GTAAT, ATTAC, 

GAAAG, CTTTC, TTTTT, AAAAA, 
GTAAT, ATTAC, ATTGT, ACAAT, 
GAAAT, ATTTC, ATTTT, AAAAT, 
GTAAG, CTTAC, TTTGT, ACAAA, 

TTAATAATC GAT , ATCGATTATTAA, ATCG ATTATTG G , CCAATAATCGAT, 
ATCGATTA, TAATCGAT, TAATCGAT, ATCGATTA, 

ATCGATCGG, CCGATCGAT, TCGATCGAT, ATCGATCGA, 
ATCGATCGT, ACGATCGAT, GCGATCGAT, ATCGATCGC, 

TATCGATA, TATCGATA, TATCGGTG, CACCGATA, 
TATTAATA, TATTAATA, TATTGGTG, CACCAATA, 

GTGTAATATTT, AAATATTAC AC , GGGTATTGTAT, ATACAATACCC, 
GTGTAATTTTT, AAAAATTACAC, GGGGATTGTAT, ATACAATCCCC, 
ATGT AATTTTT , AAAAATTACAT, GGGGATTGTAT, ATACAATCCCC, 
ATGTAATATTT, AAATATTACAT, GGGTATTGTAT, ATACAATACCC, 
ATTACGTGGT, ACCACGTAAT, ATTACGTGGT, ACCACGTAAT, 
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TGACGTAA, TTACGTCA, TTACGTTA, TAACGTAA, 
TGACGTTA, TAACGTCA, TGACGTTA, TAACGTCA, 
TTACGTAA, TTACGTAA, TTACGTAA, TTACGTAA, 
TGACGTTA, TAACGTCA, TAACGTTA, TAACGTTA, 

TGACGT, ACGTCA, GCGTTA, TAACGC, 
TGACGT, ACGTCA, ACGTTA, TAACGT, 
TTTCGCGT, ACGCGAAA, GCGCGAAA, TTTCGCGC, 
TTTGGCGT, ACGCCAAA, GCGTTAAA, TTTAACGC, 

TAGGTGTTA, TAACACCTA, TAATATTTG, CAAATATTA, 
TAGGTGTTT, AAACACCTA, GAATATTTG, CAAATATTC, 

GTAGGTGG, CCACCTAC, TTATTTGT, ACAAATAA, 
GTAGGTGT, ACACCTAC, ATATTTGT, ACAAATAT, 

TGCGTGGGCGG, CCGCCCACGCA, TCGTTTACGTA, TACGTAAACGA, 
TGCGTGGGCGT, ACGCCCACGCA, ACGTTTACGTA, TACGTAAACGT, 

TGCGTAGGCGT, ACGCCTACGCA, ACGTTTACGTA, TACGTAAACGT, 
TGCGTAGGCGG, CCGCCTACGCA, TCGTTTACGTA, TACGTAAACGA, 
ATAGGAAGT, ACTTCCTAT, A I I I I I TGT, ACAAAAAAT, 

TCGGAAGT, ACTTCCGA, ATTTTCGG, CCGAAAAT, 
TCGGAAGT, ACTTCCGA, GTTTTCGG, CCGAAAAC, 
TCGGAAAT, ATTTCCGA, ATTTTCGG, CCGAAAAT, 
TCGGAAAT, ATTTCCGA, GTTTTCGG, CCGAAAAC, 
GTAAATAA, TTATTTAC, TTGTTTAT, ATAAACAA, 
GTAAATAAATA, TATTTATTTAC, TGTTTATTTAT, ATAAATAAACA, 

AAAGT AAATA , TATTTACTTT, TGTTTATTTT, AAAATAAAC A , 
AATGTAAATA, TATTTACATT, TGTTTATATT, AATATAAACA 
TAAGTAAATA, TATTTACTTA, TGTTTATTTA, TAAATAAAC A , 
TATGTAAATA, TATTTACATA, TGTTTATATA, TATATAAACA, 

ATAAATA, TATTTAT, TGTTTAT, ATAAACA, 
ATAAATA, TATTTAT, TATTTAT, ATAAATA, 
GATA, TATC, TATT, AATA, 

TAGATAA, TTATCTA, TTATTTG, CAAATAA, 
TTGATAA, TTATCAA, TTATTAG, CTAATAA, 
GATAA, TTATC, TTATT, AATAA, 

GATG, CATC, TATT, AATA, 

GATAG, CTATC, TTATT, AATAA, 
GATAAG, C TTATC, TTTATT, AATAAA, 
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TGTTTATTTA, TAAATAAACA, TAAATAAATA, TATTTATTTA, 
TGTTTGTTTA, TAAACAAACA, TAAATAAATA, TATTTATTTA, 
TATTTATTTA, TAAATAAATA, TAAATAAATA, TATTTATTTA, 
TATTTGTTTA, TAAAC AAATA , TAAATAAATA, TATTTATTTA, 

GTTAATGATT, AATC ATTAAC , AATTATTAAT, ATTAATAATT, 
GTTAATTATT, AATAATTAAC, AATAATTAAT, ATTAATTATT, 
GTTAATTAAT, ATTAATTAAC, ATTAATTAAT, ATTAATTAAT, 
GTTAATGAAT, ATTCATTAAC, ATTTATTAAT, ATTAATAAAT, 

TAAAGTTTA, TAAACTTTA, TGAATTTTG, CAAAATTCA, 
TAAAGGTTA, TAACCTTTA, TGATTTTTG, CAAAAATCA, 

AAAGTGAAATT, AATTTCACTTT, GGTTTTATTTT, AAAATAAAACC, 
AAAGCGAAATT, AATTTCGCTTT, GGTTTCGTTTT, AAAACGAAACC, 

TAGTTTTATTTTTTT, AAAAAAATAAAACTA, G G G AAAGTG AAATTG , 
CAATTTCACTTTCCC , 

TAGTTTTATTTTTTT, AAAAAAATAAAACTA, GGAAAAGTGAAATTG, 
CAATTTCACTTTTCC , 

TAGTTTTTTTTTTTT, AAAAAAAAAAAACTA, GGAAAAG AG AAATTG, 
CAATTTCTCTTTTCC , 

TAGTTTTTTTTTTTT, AAAAAAAAAAAACTA, GGGAAAG AG AAATTG, 

CAATTTCTCTTTCCC, 

TAGGTG, CACCTA, TATTTG, CAAATA, 

TTTT AAAAAT AATTTT , AAAATTATTTTTAAAA , AGGGTTATTTTTAGAG, 
CTCTAAAAATAACCCT, 

TTTTAAAAAT AATTTT , AAAATTATTTTTAAAA, G G AGTTATTTTTAG AG , 
CTCTAAAAATAACTCC, 

TTTTAAAAAT AATTTT , AAAATTATTTTTAAAA, AG AGTTATTTTTAG AG, 
CTCTAAAAATAACTCT, 

TTTT AAAAAT AATTTT , AAAATTATTTTTAAAA, G G G G TT ATTTTTAG AG , 
CTCTAAAAATAACCCC , 

TGTTATTAAAAATAGAAA, TTTCTATTTTTAATAAC A , 
I I I I I ATTTTTAGTAATA, TATTACTAAAAATAAAAA, 
TGTTATTAAAAATAGAAT, ATTCTAI I I I I AATAACA, 
GTTTT ATTTTTAGTAATA , TATTACTAAAAATAAAAC, 
TTTGGTAT, ATACCAAA, GTGTTAAA, TTTAACAC 
GGGGA, TCCCC, TTTTT, AAAAA, 

TAGGGG, CCCCTA, TTTTTA, TAAAAA, 
GAGGGG, CCCCTC, TTTTTT, AAAAAA, 

TGTTGAGTTAT, ATAACTCAACA, ATGATTTAGTA, TACTAAATCAT, 
TGTTGATTTAT, ATAAATCAACA, GTGAGTTAGTA, TACTAACTCAC, 
TGTTGAGTTAT, ATAACTCAACA, ATGATTTAGTA, TACTAAATCAT, 
TGTTGATTTAT, ATAAATCAACA, GTGAGTTAGTA, TACTAACTCAC, 
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GGGGA Mill, AAAAATCCCC, GGGAATTTTT, AAAAATTCCC, 
GGGGATTTTT, AAAAATCCCC, GGGGATTTTT, AAAAATCCCC, 
GGGGATTTTT, AAAAATCCCC, GGAAATTTTT, AAAAATTTCC , 
GGGAATTTTT, AAAAATTCCC, GGAAATTTTT, AAAAATTTCC, 
GGGAATTTTT, AAAAATTCCC, GGAAATTTTT, AAAAATTTCC, 
GGGATTTTTT, AAAAAATCCC, GGAAAGTTTT, AAAACTTTCC, 
GGGAATTTTT, AAAAATTCCC, GGGAATTTTT, AAAAATTCCC, 
GGGATTTTTT, AAAAAATCCC, GGGAAGTTTT, AAAACTTCCC, 
G G G ATTTTTT A , TAAAAAATCCC, TGG AAAGTTTT , AAAACTTTCCA, 
TTTAGTATTACGGATAGAGGT, ACCTCTATCCGTAATACTAAA, 
GTTTTTGTTCGTGGTGTTGAA, TTCAACACCACGAACAAAAAC, 
TTTAGTATTACGGATAGAGTT, AACTCTATCCGTAATACTAAA, 
G GTTTTGTTC GTG GTGTTG AA , TTCAACACCACGAACAAAACC, 
TTTAGTATTACGGATAGCGTT, AACGCTATCCGTAATACTAAA, 
G G C GTTGTTC GTG GTGTTG AA , TTCAACACCACGAACAACGCC, 
TTTAGTATTACGGATAGCGGT, ACCGCTATCCGTAATACTAAA, 
GTCGTTGTTCGTGGTGTTGAA, TTCAACACCACGAACAACGAC, 

AT ATGTAAAT , ATTTACATAT, ATTTGTATAT, ATATAC AAAT , 
TTATGTAAAT, ATTTACATAA, ATTTGTATAA, TTATACAAAT, 

GAATATTTA, TAAATATTC, TGAATATTT, AAATATTCA, 
GAATATGTA, TACATATTC, TGTATATTT, AAATATACA, 

ATAAT, ATTAT, ATTAT, ATAAT, 
GTAAT, ATTAC, ATTAT, ATAAT, 

AATGTAAAT, ATTTACATT, ATTTGTATT, AATACAAAT, 

ATTTGTATATT, AATATACAAAT, GGTATGTAAAT, ATTT AC ATAC C , 
ATTTGTATATT, AATATACAAAT, AATATGTAAAT, ATTTACATATT, 
ATTTGTATATT, AATATACAAAT, AGTATGTAAAT, ATTTACATACT, 
ATTTGTATATT, AATATACAAAT, GAT ATGTAAAT, ATTTAC ATATC , 

AGGAGT, ACTCCT, ATTTTT, AAAAAT, 
GGGAGT, ACTCCC, ATTTTT, AAAAAT, 

G G ATATGTTC G G GTATGTTT , AAACATACCCGAACATATCC, 
GGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCC, 
G G ATATGTTC G G GTATGTTT , AAACATACCCGAACATATCC, 
AGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCT, 
TC GTTTC GTTTTAG ATAT , ATATCTAAAACGAAACGA, 
ATATTTAGAGCGGAACGG, CCGTTCCGCTCTAAATAT, 

CGTTACGGTT, AACCGTAACG, AATCGTGACG, CGTCACGATT, 
CGTTACGGTT, AACCGTAACG, GATCGTGACG, CGTCACGATC, 
CGTTACGTTT, AAACGTAACG, AAGCGTGACG, CGTCACGCTT, 
CGTTACGTTT, AAACGTAACG, GAGCGTGACG, CGTCACGCTC, 
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TTTACGTATGA, TCATACGTAAA, TTATGCGTGAA, TTCACGCATAA, 
TTTAC GTTTG A , TCAAACGTAAA, TTAAGCGTGAA, TTCACGCTTAA, 
TTTAC GTTTTA , TAAAACGTAAA, TGAAGCGTGAA, TTCACGCTTCA, 
TTTACGTATTA, TAATACGTAAA, TGATGCGTGAA, TTCACGCATCA, 

AATTAATTAA, TTAATTAATT, TTGATTGATT, AATCAATCAA, 
TATTAATTAA, TTAATT AATA , TTG ATTGATG , CATCAATCAA, 

TAATTAT, ATAATTA, ATGATTG, CAATCAT, 

TAGGTTA, TAACCTA, TGATTTA, TAAATCA, 

TTTTAAATATTTTT, AAAAAT ATTT AAAA , GGGGGTGTTTGGGG, 
CCCCAAACACCCCC, 

TTTTAAATTATTTT, AAAATAATTTAAAA, GGGGTGGTTTGGGG, 
CCCCAAACCACCCC , 

TTTTAAAT MINI, AAAAAAATTT AAAA , GGGGGGGTTTGGGG, 
CCCCAAACCCCCCC, 

TTTTAAAT AATTTT , AAAATTATTTAAAA, GGGGTTGTTTGGGG, 
CCCCAAACAACCCC, 

GAGGCGGGG, CCCCGCCTC, TTTCGTTTT, AAAACGAAA, 
GAGGTAGGG, CCCTACCTC, TTTTGTTTT, AAAACAAAA, 
AAGGCGGGG, CCCCGCCTT, TTTCGTTTT, AAAACGAAA, 
AAGGTAGGG, CCCTACCTT, TTTTGTTTT, AAAACAAAA, 

GGGGGCGGGGT, ACCCCGCCCCC, ATTTCG Mill, AAAAACGAAAT, 
GGGGGCGGGGT, ACCCCGCCCCC, GTTTCG I I I I I , AAAAACGAAAC, 
TATTATTTTAT, ATAAAATAATA, GTGGGGTGATA, TATCACCCCAC, 
GATTATTTTAT, ATAAAATAATC, GTGGGGTGATT, AATCACCCCAC, 

ATTACGTGAT, ATCACGTAAT, ATTACGTGAT, ATCACGTAAT, 
ATTACGTGAT, ATCACGTAAT, GTTACGTGAT, ATCACGTAAC, 

TTTTATATGG, CCATATAAAA, TTATATAAGG, CCTTATATAA, 
TTATATATGG, CCATATATAA, TTATATATG G , CCATATATAA, 
AAATAAT, ATT ATTT, GTTGTTT, AAACAAC, 
AAATTAA, TTAATTT, TTAGTTT, AAACTAA, 
AAATTAT, ATAATTT, GTAGTTT, AAACTAC, 
AAATAAA, TTTATTT, TTTGTTT, AAACAAA, 

ATTTTTCGGAAATG, CATTTCCG AAAAAT, TATTTTCGGGAAAT, 
ATTTCCCGAAAATA, 

ATTTTTCGGAAATG, CATTTCCGAAAAAT, TATTTTCGGGAAAT, 
ATTTCCCGAAAATA, 

ATTTTCGGGAAATG, C ATTTC C C G AAAAT , TA I I I I I CGGAAAT, 
ATTTCCGAAAAATA, 

ATTTTC G G G AAGTG , CACTTCCCGAAAAT, TATTTTTCGGAAAT, 
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ATTTCCGAAAAATA, 

AATAGATGTT, AACATCTATT, AATATTTGTT, AACAAATATT, 
AATAGATGGT, ACCATCTATT, ATTATTTGTT, AACAAATAAT, 

GTATAAATA, TATTTATAC, TATTTATAT, ATATAAATA, 
GTATAAATG, CATTTATAC, TATTTATAT, ATATAAATA, 
GTATAAAAA, TTTTTATAC, TTTTTATAT, ATATAAAAA, 
GTATAAAAG, CTTTTATAC, TTTTTATAT, ATATAAAAA, 
TTATAAATA, TATTTATAA, TATTTATAG, CTATAAATA, 
TTATAAATG, CATTTATAA, TATTTATAG, CTATAAATA, 
TTATAAAAA, TTTTTATAA, TTTTTATAG, CTATAAAAA, 
TTATAAAAG, CTTTTATAA, TTTTTATAG, CTATAAAAA, 
GGGGGTTGACGTA, TACGTCAACCCCC, TGCGTTAATTTTT, 
AAAAATTAACGCA, 

GGGGGTTGACGTA, TACGTCAACCCCC, TACGTTAATTTTT, 
AAAAATTAACGTA, 

TGACGTATA Mill, AAAAATATACGTCA, GGGGATATGCGTTA, 
TAAC G C ATATC C C C , 

TGACGTATATTTTT, AAAAATATACGTCA, GGGGGTATGCGTTA, 
TAACGCATACCCCC, 

ATGATTTAGTA, TACTAAATCAT, TGTTGAGTTAT, ATAACTCAACA, 
GTTAT, ATAAC, ATGAT, ATCAT, 

TTACGTGA, TCACGTAA, TTACGTGG, CCACGTAA, 
TTACGTGG, CCACGTAA, TTACGTGG, CCACGTAA, 
TTACGTGG, CCACGTAA, TTACGTGA, TCACGTAA, 
TTACGTGA, TCACGTAA, TTACGTGA, TCACGTAA, 
GACGTT, AACGTC, AGCGTT, AACGCT, 

TGACGTGT, ACACGTCA, ATACGTTA, TAACGTAT, 
TGACGTGG, CCACGTCA, TTACGTTA, TAACGTAA, 

CGGTTATTTTG, CAAAATAACCG, TAAGATGGTCG oder CGACCATCTTA 



enthalt, welche zu einer solchen DNA komplementar ist oder dieser entspricht, wie 
sie entstehen wurde, wenn ein ebenso langes DNA Fragment, welches iiber seine 
Sequenz oder Sekundarstruktur die spezifische Lokalisierung von 
Genom/Chromatinabschnitten innerhalb des Zellkerns herbeifiihren kann, einer 
chemischen Behandlung gemaS Anspruch 1 unterzogen wurde. 



19.Verfahren nach einem der Anspruche 16 bis 18, dadurch gekennzeichnet, daB die 
zur Amplifikation verwendeten Oligonukleotide auBer den in den Anspruchen 16 bis 
18 definierten Konsensussequenzen mehrere Positionen enthalten, an denen 
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entweder irgendeine der drei Basen G, A und T oder irgendeine der Basen C, A und 
T vorhanden sein kann. 

20. Verfahren nach Anspruch 19, dadurch gekennzeichnet, da(2> die zur Amplifikation 
verwendeten Oligonukleotide aulier einer der in den Anspruch 18 beschriebenen 
Konsensussequenzen nur maximal zusatzlich so viele weitere Basen enthalten, wie 
es zur gleichzeitigen Amplifikation von mehr als einhundert verschiedenen 
Fragmenten pro Reaktion aus der chemisch behandelten DNA, berechnet 
entsprechend Anspruch 8, erforderlich ist. 

21. Verfahren nach einem der vorangehenden Anspruche dadurch gekennzeichnet, dali 
die Untersuchung des Sequenzkontextes aller oder eines Teils der in den 
ampiifizierten Fragmenten enthaltenen CpG Dinukleotide oder CpNpG Trinukleotide 
gemali Anspruch 1 c) durch Hybridisierung der bereits in der Amplifikation mit einem 
Fluoreszenzmarker versehenen Fragmente an einen Oligonukleotid- Array (DNA 
Chip) erfolgt. 

22. Verfahren nach einem der Anspruche 1 bis 20 dadurch gekennzeichnet, da& die 
ampiifizierten Fragmente auf einer Oberflache immobilisiert und anschlieliend eine 
Hybridisierung mit einer kombinatorischen Bibiliothek von unterscheidbaren 
Oligonukleotid- oder PNA-Oligomer-Sonden durchgefuhrt wird. 

23. Verfahren nach Anspruch 22 dadurch gekennzeichnet, daft die Sonden mittels 
Matrix-assistierter Laser-Desorptions/lonisations Massenspektrometrie (MALDI-MS) 
anhand ihrer eindeutigen Masse nachgewiesen werden und damit der 
Sequenzkontext aller oder eines Teils der in den ampiifizierten Fragmenten 
enthaltenen CpG Dinukleotide oder CpNpG Trinukleotide entschlusselt wird. 

24. Verfahren nach einem der vorangehenden Anspruche, dadurch gekennzeichnet, 
daB die Amplifikation wie beschrieben in Schritt b) des Anspruchs 1 durch eine 
Polymerase Kettenreaktion ausgefuhrt wird, in der die GrolJe der ampiifizierten 
Fragmente mittels auf weniger als 30 s verkurzter Kettenverlangerungsschritte 
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begrenzt wird. 

25. Verfahren nach einem der vorangehenden Anspruche, dadurch gekennzeichnet, 
daR nach der Amplifikation gemaB Schritt b) des Anspruchs 1 die Produkte durch 
Gelelektrophorese aufgetrennt werden und die Fragmente, die kleiner als 2000 
Basenpaare oder kleiner als ein beliebiger Grenzwert unterhalb von 2000 
Basenpaaren sind, durch Ausschneiden von den anderen Produkten der 
Amplifikation vor der Auswertung gemafc Schritt c) des Anspruchs 1 abgetrennt 
werden. 

26. Verfahren nach Anspruch 25 dadurch gekennzeichnet, da& nach der Abtrennung 
von Amplifikaten bestimmter Grolie diese vor der Durchfuhrung des Schrittes c) des 
Anspruchs 1 nochmals amplifiziert werden. 

27. Kit, enthaltend mindestens zwei Primerpaare, Reagenzien und Hilfsstoffe fur die 
Amplifikation und/oder Reagenzien und Hilfsmittel fur die chemische Behandlung 
gemaR Anspruch 1 a) und/oder eine kombinatorische Sondenbibliothek und/oder 
einen Oligonukleotid-Array (DNA-Chip), soweit sie fur die Durchfuhrung des 
erfindungsgema&en Verfahrens erforderlich oder dienlich sind. 
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SEQUENZPROTOKOLL 

ALLGEMEINE ANGABEN : 
ANMELDER: 

NAME: Epigenomics AG 
STRASSE: Kas t anienallee 24 
LAND: Berlin 
POSTLEITZAHL: 10435 
TELEFON: 030-243450 
TELEFAX: 030-2 4345555 

BEZEICHNUNG DER ERFINDUNG: Verfahren zur parallelen Detektion 

des Methylierungs zustandes von 
genomischer DNA 

ANZAHL DER SEQUENZEN: 31 

COM PUT ERLES BARE FAS SUNG : 

DATENTRAGER: Diskette 
COMPUTER: IBM PC-komt at ibel 
BETRIEBS SYSTEM : PC-DOS /MS- DOS 

DATEN DER JETZIGEN ANMELDUNG : 

ANMELDENUMMER: nicht bekannt 
ANMELDETAG: 6.12. 2000 

ANGABEN ZU SEQ ID-NO: 1: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 12 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandel te Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 1: 

AGTAGTAGTA GT 12 

ANGABEN ZU SEQ ID-NO: 2: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 12 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandel te Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 2: 

AAAACAAAAA CC 12 

ANGABEN ZU SEQ ID-NO: 3: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 973 Basen 
ART: Nukleinsaure 
STRANGFORM : Einzelstrang 
TOPOLOGIE: linear 
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ART DES MOLEKULS: chemisch vorbehandelt e Genom-DNA 



SEQUENZBESCHREIBUNG: SEQ ID-NO: 3: 



AGTAGTAGTA 
TTTTAGTAGG 
ATATTTTTGT 
TATGTTTGAG 
GTGATTTATT 
TGAAAGTGGA 
TTATTTTTAG 
TGAGCGGAGC 
TAGAGTCGTC 
GGCGGGGAGG 
TATTTTTTAG 
GTGGAATCGT 
GGGTTCGTAG 
TTGCGGGTTT 
TTTGCGGGGT 
AAGATTGTAT 
GGGTTTTTGT 



GTAGCGTTTT 
AGTGTTTTTG 
AAAAT T T TAG 
TTGTTTTATA 
GAAAGGCGAT 
CGTAGTTCGG 
TTCGGTTTTT 
GTTTCGGGGT 
GCGCGTTTAG 
CGTCGAGGGT 
GCGGTAGGCG 
ACGTGTTTGG 
TGGGATTCGC 
CGTAATTATT 
TTTTTACGAA 
TTTTGTTTTG 
TTT 



TGAAGTTTTT 
GGGAGGGAGT 
GAATTATTAG 
TAGTGTAGAA 
GCGCGTTTTT 
TGTTAGGTGT 
AG AT ATT TTT 
GTGAGGAGAA 
TTTCGTTACG 
AGTTAAGGGG 
TATGCGTATT 
TTTTGTAGTT 
GGAGAGGGGC 
ATTCGTGATA 
TTTATTATAT 
TAAATTATTA 



TGTGGAAGGT 
GAGTGGGAGA 
TATTTTATTT 
ATTGAGAATG 
TTTTTGTAGG 
TAGCGATTTG 
CGAGGCGTTT 
TCGGTAAATT 
TTGGTTGTCG 
AGTAGGTTAC 
TTTTATTTGC 
AGGGGTTTTT 
GCGGCGGGGC 
ATTATAGTTT 
TTAATATTCG 
GTTTCGTAAT 



GAGAAATTTA 
TTAGAAATGG 
TTTTTTATAA 
TAAACGTGTA 
TAGAATTGTT 
AGTTCGTTTT 
TTTTTTGTTC 
TTCGCGGGCG 
AGCGTATTTC 
GTGAGAGGAG 
GTTTCGGTCG 
GGTTCGGGGC 
GGAGCGTTTG 
TTGGAGAGTT 
TGAATTTAGA 
TTAGAATTTA 



TCGATAAGTT 
GGTCGGTGGA 
AGATTGTTTT 
AACGATCGGT 
TTAGGAAGTA 
CGGGTTTTAT 
GTTCGATTTT 
TTGGGCGTCG 
GGTTGCGTTC 
GAGTTTGATT 
GGAGGTTTAC 
GCGTAGGGGC 
GAGATTTAGT 
GTTTAGGTTT 
AATTAAGATA 
TTTTGTAAAT 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
973 



ANGABEN ZU SEQ ID-NO: 4: 

SEQUENZCHARAKTERI STIKA : 
LANGE: 1890 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzel Strang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandel te Genom-DNA 

SEQUENZBESCHREIBUNG : SEQ ID-NO: 4: 

AGTAGTAGTA GTTAAGTTTA AGAGTGATAT TTTTTTAGAT ATAGTATAAT ATTGTTTTTG 60 

TAAAAGGTTA TTTATATGAA TATAATGTTT TTTGGGTTAA TTAATTCGTT TTGAGAATAG 120 

TTAGGTTAAA ATTTTTAGGT TTTTTATTTT GGGTTATTTA AGTTAGGATC GCGACGTGAG 18 0 

TTCGGGGTGA GTCGAGGGGT ATTTCGGGTC GAGGTTATTC GAATCGAAGT TATGAGGCGC 24 0 

GGGTCGGTAA TCGGAAGTGG TTTAGGGAGA GTTGTACGAG ATTCGGGGGT TGTGATTTGG 300 

AAATAAAATA AAATAAAATA AAATTTTAAT TGTTTTGGGA TTGATTTTTA AAAGAGCGTT 3 60 

TTTTTGGTTT AAGAGGTCGG CGTTCGCGGA GATGTCGTTT TAAAGGGTTG TTTTTTAAGC 420 

GTGTAGGTCG CGTACGGGTT TTTTTAGCGG GCGGGTAAAA TGGGCGTCGG TATTCGGGAG 4 80 

GCGTTTGTTT AGGCGTTCGG GCGTCGTTTA TAGAGTACGT TCGTTTGCGG TTTTAGAGCG 54 0 

TCGTTTTTTT GTCGTTTTCG TCGTTCGGTT TGACGTTCGG ATCGCGGTCG GTTATCGTTT 600 

TTCGTTTCGA CGGTTACGTT TGTTTTAAAT CGCGCGGGCG TTTTTTAGGT GTTGTTGGGC 660 

GGGTTTCGTT TTCGTGTTTT AAGGTTCGTT TTCGCGCGTT AGTCGCGCGT TCGTTGTTTT 720 

TTTTTCGTTT TTATAGTTTC GTTTTTATAG TTTCGTTCGT TTTTTAAGTT TCGTTTTTTA 780 

GGAATTCGCG CGTCGAAGGT TAGGTTTGGG CGGAGCGTAT AGCGTTGGGC GTTGGGGAGG 84 0 

TTGCGTCGTA GTATTCGGTT GGTTAGGATT AAGTGGGTTC GAGGCGGACG TGAGAAGGGT 900 

CGGGTTAAGA TGGCGGTGTA GGTGGTGTAG GCGGTGTAGG CGGTTTATTT CGAGTTTGAC 960 

GTTTTTTTCG TTTGTTTTAA TTACGTTTTG AG T AT AGAGA AGGAGGAAGT AATGGGGTTG 102 0 

TGTATAGGGG AGGTGAGTAG GTTTGTTAGT TTGGATGGAA TTTTGTTGAG TAGTTTTAGT 1080 

GTGTTTTCGG GGTGGGTGTC GGTAGTTTTT AGGGTTGCGG AGGTTATAGG TATTTTCGAT 114 0 

TTAGGTTTTT GGATATTTTT TATATAGTTT TGTCGCGGGG AGTTTCGTTT TTTTTGGTCG 1200 

TTTGATATTT GTTTAGTTTT TTGCGAGTTT TCGGCGGTTT GTATAGGTTT CGGGAGTTTT 12 60 

GTTTTTTTTT TTGTAGTTTG GGGTTTTTTT TTAGATTTGC GTTTTTCGTT CGGTTGATTA 1320 

AAATTGTAAG GTAGGTTAGA AAGATATTGG AGTATAATGA GGATGTTCGG GTATTACGAC 138 0 

GTAGTAGTTG ATTATAGTTA GAGTTTTTTG TTTCGTTTCG AGTTTTTTGT TTAGGGAGTA 14 4 0 

GAGATATTAA TTAAAGTATT TGAAGGGTAT CGAAGAGTTT AATAGAAGGT GCGGGGTTTG 15 0 0 

AAGGAAGTAA AAGTTTTCGT TGTATTGTGT TGAGGAGGGG TCGAAGAGGA TGAGGAAATA 15 60 

TAGTTTAGTT GTTTATAGTT TAAAGTAATT TTTTAGTTTT TTATATTATG TGCGTGAATA 162 0 

TATGATTTAA TTGTTATATA ATTTGTATTT ATATATGTTA AATAAACGTA ATGTGATTAA 168 0 
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TAATGTTTTT TGTTTTTTTT TATTTTAGTT GAACGAT GAT ATAAGGTAAG ATTGTATTTG 17 40 

TTTATTTATA TTTTATAATT TTTAAGTTAT TGTTAATTTA AAATTATGGC GATTTTGGTA 1800 

GTATTGTGTT CGGATCGTGT TTTAAATTAA TTATTATTAT TATTTCGGGG TTTTTTTAAT 18 60 

GATATAATTT TGAATTTTGG TTTTTGTTTT 18 90 

AN GAB EN ZU SEQ ID-NO: 5: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 2222 Basen 
ART: Nukleinsaure 
STRANGFORM : Einzel Strang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandel t e Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 5: 

AGTAGTAGTA GTTTTGGAGA GTAAGTGGGT TTTATGTAAA GTGTTATTTG TTATATATTG 60 

TTATTTTTAN AGGATTTTAG AATATTTTCG AATTCGAAAA TAGAGTGAGT GTGGAGGGGA 12 0 

GGGGGGTGTT TACGTGGAGG AGGGTCGCGA GAAGGAGAGT GCGTCGGGTT GATGGTTAGC 18 0 

GGTGTTTCGG GGGTCGATGT CGGGCGGGAT CGGCGGCGCG GGGGTGGGGC GACGGCGGGG 24 0 

CGGCGGTCGA GTAGTAGAGG GGCGTTTCGT AGAGGTCGGG GGGGGCGCGG GGTTTCGCGT 300 

CGTTTTGTTA GTAGTCGTTT CGTCGTTTTT TTCGGTTCGT TCGTAATCGT CGCGGGATTC 3 60 

GTCGGTTCGG GTTTTTGGAA TTTTTTACGG GGGATAGTCG ATCGGGGGCG TCGGGGTTCG 420 

TTTTCGTATT CGATTCGGAC GGCGGTAGTA GGGGGAGGGA TGGTGTATCG AGGAAGTTAA 4 80 

GGTTTTATTA TTTTGTTCGG CGGGTCGGCG GTTCGTTGGT TCGTTGGTTC GGAGAAGTGT 54 0 

TGCGTTTAGG TTGGTTCGTA GGAAACGGCG GCGGCGGTTT ANTTNTANTT TTNNNNTTNT 600 

TNNTTGNNAN TNTTTTTTTA TAGGGGAGGG GTAGGCGGTT CGCGGGTTTC GCGTCGGTCG 6 60 

GGCGATTGGG TACGCGAGGG AGCGGGTAGG GTAGGGGGAA ATAAATTAAG GTCGAGATTT 720 

AGAGT CGGAG AGCGCGGGAG GAGTAGCGGC GAGAGGTAGG AGAGGTAGAG AAGAAGAAAG 7 80 

GAGGGAGAGA GGGGGCGAAG ACGGTCGGGA AATTCGGGGT TGTAGTTTCG CGTCGCGTCG 840 

GAGTCGTGAC GGATTTATTG TAGCGGTCGC GTTGATTCGT AATTTTAAGG TACGAAAAAA 900 

GGGGAGGGTA GAGAGGGAGG GGAAAGCGGA GTGTTGTAGC GTCGGGGCGG GGGCGGGTTT 960 

TCGCGAGCGT CGTATATTCG GGAATTTGTN GTTTCGTTGC GGGCGAGTGT CGCGTGTTTT 1020 

GGCGAGTTTT GGTTGGGGAA NTTTGAGCGC GCGGATTACG TTCGTTTTTT AGTCGGTCGT 1080 

TTTTTGCGTG TAGGGTGGGG GGAGGTTAGG GGCGGGGGCG CGGACGTCGG TGACGTCGCG 114 0 

TGGCGGAGTT TTTTCGGTTA TGTGGTTGGA GGCGGGCGGG GAAGAAGGTA AGGTTGGGAG 1200 

GGGAAGGAGG AAATGCGAGG GTTTTTCGGC GGGAGGAAGC GCGAGGGGTG CGCGAGTGTT 12 60 

AGCGAAAGGG GGATAGGGGT TTTGGAGTGG AAGTTTTGCG GGAGAGGAGG AGTAGAGGAG 132 0 

TAGTTTTAGG GTGTTAGAAT TATTCGGATG TCGTATTAAA AAATAGGAAA AATTTAAGTT 1380 

TTGCGAGAGG TAGTTAAAGG TATTTGTGTA TTCGTGTATC GATTTGGATT TATTATAGAA 14 4 0 

TTGTACGGTT TATTAGGATT GTTGTTATTT CGGTGTAGTA TTCGTAGGTT TATTTGTAAT 15 00 

ATGAATTGGT AGAGTTAGGA ATTAGGTTGT AAAGATAGAG AAGCGAGTTA AAGTTGGTCG 15 60 

TAGTTCGAGG CGTGGGGAGA ATTTGGGTAA ACGAGGAGAA GGGATATTTT TTATTCGTAG 162 0 

AAAGATTTTT TATTTAGTTT TGTATTTTTA TAAATCGTTT AGATTTTTTT TTGGCGGAGT 168 0 

TTATTAGTTT TTGTTTAAAA AAAGAAAAAA ATTCGAATGT AGATTGTTCG TTTATTTTTT 17 4 0 

TAGTAGAGTT ATATTTATTT TTGTGGTAAT TATTTTTTTA GAAAATTTAG ATTATAATAG 18 00 

GAAAT TAT AT TTAGAAAAGT ATAAGGAGGA AATTTATGTT C G AG AG AAG A AATAAAGTTG 18 60 

TTAGGAGAGG TGTGATGAGG ATAACGAAGA AAATATTTTG TAATTATTTT AATTAGTTAT 192 0 

TTTTTTATAA GTTTTGATAA TCGTTCGTAT TCGTGTGTGT TTGAGAGTGT GTGTGTGTGT 198 0 

GTGTGTGTGT GTGAGAGAGA GAGAGAGGAT GTTTTTTGAG TGATCGGAAA TTTTTTATTG 204 0 

ATAAAGTTTT TGAGTTATTT TATAAAAAGT TATTGTGTTG TTTTTTTTTA AAAAAGTTTT 2100 

AATGATTTTT AT AT G AGAAT TTTATTTTTT TTATGTGTTA ATTATTTTTT TATATGATGA 2160 

GTATGTATTT TTTTTTAATA AACGTTTAGC GATTTGTTTT AGGAT TAAAT GGTTTTTGTT 2220 

TT 2222 

AN GAB EN ZU SEQ ID-NO: 6: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 307 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
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TOPOLOGIE: linear 
ART DES MOLEKULS: chemisch vorbehandelt e Genom-DNA 
SEQUENZBESCHREIBUNG: SEQ ID-NO: 6: 



AGTAGTAGTA GTTTCGTTAC GAATACGATT AGTTTATATT GGTTGTTTAG TATTTCGGTT 60 

AGTTTTTGTG GGACGTTGGC GCGTATATCG TTTCGTCGGG GGGTCGGGGA TTTCGGGGAT 12 0 

TTCGGGGTCG AGGACGAGGG AG GC GAG TAG GTCGTTGGTT TCGACGATTT TGCGATCGAG 18 0 

GCGTTTGTAG TTGTTCGGGG CGAGGCGGGC GATTTTAGGT TTTCGAGTAT TTTCGAGATA 24 0 

TTCGCGTTAA GTTTGGTTTC GGGGGTGGTT GTCGTCGGGT TTCGTTTGCG TTTTTGGTTT 300 

TTGTTTT 307 



AN GAB EN ZU SEQ ID-NO: 7: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 523 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelt e Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 7: 



AGTAGTAGTA GTTGTTGTTG TTCGAGGTTT CGGTGTAGTT GGAAGTTTTG GAGGTGGGGA 60 

GAGGGATGTT AGGTAAGTGG TACGGCGAGC GTAAGGGAAG GGGTTAGTTA TTGATTAGCG 12 0 

GTAGTAATTG TAGGAATCGT CGTCGTAGTT GTAGTCGTTT TTTCGTTCGT TTTTTCGGGT 18 0 

TTTCGGGAAA ATGGTTGTGG GGTTGGTCGC GTCGTTAAGT TTGTTTTCGC GCGGTGAAGA 24 0 

GCGGGTTGTT TGGGGGAGTC GTTTTTTAAT TTCGCGGCGC GTTTATTTTT GCGGAGTTCG 300 

TGGTAGGATT CGAGGGGTTA CGAGTTGATA TTTTTTTGGG TTGTATAAAA AGTTGAGGCG 3 60 

GGCGTTGGGA GGAGGTAGCG GTTGTTGCGG TGCGGTTTTT TTTTTTTTTT ATATTTTGTT 420 

CGGGTTATTT TTTTTTTTTT TTTTTTTCGT TTTTCGTTTT TTTTTTTACG CGGGTTTTTC 480 

GGGGTTTTGG CGGTTTTCGG TTGAAGGTCG CGGTTTTTGT TTT 523 



AN GAB EN ZU SEQ ID-NO: 8: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 653 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelt e Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 8: 



AGTAGTAGTA GTAGCGTCGG GAGTTCGCGT AGAAACGATT TGATTTTTCG CGGCGTTATT 60 

TTTTTTTGCG ATTGGCGTTG CGCGGAGAAA ATTTAGTTTG TCGATGTTTC GTTTATTATT 120 

TCGTTTTTAT TTATCGCGCG GTTTTTTGGG AATTGTAGTT TTTTCGTGAG CGGTCGGTAG 180 

CGGCGAGGTC GTCGGCGGAT TTTAGCGTTT AGGAAGTTTT GCGTAGGCGT AAGCGTTTTT 24 0 

TAGGTAATTA CGTCGCGGTT CGAGGTTGTA GATTTTGGTA GGGGATATAA TTGGAGAATG 300 

AGGGTGGTCG GGTGGGAGTA GGGATTAGGT TTTATTTAGA GTTCGGAGTT TGGAGTTCGT 3 60 

AC GAT TC GAG GTTTTTTTTT TTTTTTGTTT TATAGAAAGA GCGGAAAGTT TAAGAATCGG 4 20 

GTCGCGTTTG GTTGAGTTTG ATAATGTTTC GGTTTTACGC GTATTGACGT CGATTTTTGT 4 80 

ATGTTTAGTG TCGTTGCGGG GTTGGTATTG CGGTTCGGGT TTGGCGTTGA GGAGTTTGGT 54 0 

TTAGTTCGTT TTTGTTTTTC GCGGAGCGTT TGGTCGTGGG TAAGTTTAGG TTAGGTTGTT 600 

TCGGGGACGT AGGGTCGCGT AGACGTTTTT TTACGTTTCG GGGTTTTTGT TTT 653 



ANGABEN ZU SEQ ID-NO: 9: 

SEQUENZCHARAKTERISTIKA: 
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LANGE: 14 61 Basen 

ART: Nukleinsaure 

ST RANG FORM : Einzel Strang 

TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandel t e Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 9: 

AGTAGTAGTA GTAGGCGGTG GTTAGGTCGG GTCGGGCGGT TATTAGCGGT TTTCGGAGGT 60 

ATTTAGGTTT TACGGTCGAG TTTTTGGTCG GAGATCGGTC GTTTACGGGG GGTTATAGTA 120 

GCGGTCGTTC GTTTAGGATG GAGAGGCGGG TTTTAGGTTC GGTTCGGAGC GAGTTTTTTA 18 0 

GGGTTTGTCG ATACGGCGGG GTTCGGTGGT CGGTATTTGG TTCGTACGTG TTCGAGGGGT 24 0 

TTTCGGGTTT TCGGTATTAT GGTTATTATC GGGGTTTCGA TTACGACGAG GTCGATGGTT 300 

CGGGTAGCGG GGGCGGCGAG GAGGTTATGG TCGGGGTTTA CGACGCGTTA TTTTTCGTAC 360 

GATACGCGTT TTCGGGCGTT ATCGGGCGTT CGTTTAGGAT TTTTCGGGTT TCGGGTTCGG 420 

TTTGCGTTTC GTTTTTTCGG TACGGTCGGC GATTTTTTAA CGGTTATTAT TCGGCGTACG 48 0 

GATTGGTTAG GTTTCGCGGG TCGGGTTTTA GGAAGGGTTT GTACGAATTT TATAGCGAGA 54 0 

GTGACGATGA TTGGTGTTAA GTTCGGGCGA GGTGGCGTTC GTTCGGTTTT TTACGTATTT 600 

TACGTATATA TTTTATTCGA GGAGTCGCGT AGAGGTCGCG GGGGTTTAGT ATAGAGGGTT 660 

CGGGAGAGGG TTAGTCGGGA GATTTTAGAT TTTGGAGAGG TTAGGGTTGG GTTATAAGGG 72 0 

TGTTTCGTAG AGATTTTCGG T T AAAAG AG A TTTTTTTGGG TAGTTACGGC GTTTTTTAAT 780 

TAGTTTCGAT TTTTTTATTT ACGATAGGGG TTTTCGGGTG GGAGGTAGGG AGTAGATAAA 84 0 

TTATATAGTT AAGGGATTTG AATTAATTTA GTTATTTTTG GAGAATTTTG GGGAATATGA 900 

AAAAAAAAAA AAAAAAAAAA AAAAAAAATA TTTTTAAAAG AAAAAACGGG GAGAAAAAAA 9 60 

TAGTTTTTAT TGATGAGTTT TATTATTTTA ATTGAATTTT TTTTTTTTTT GATGAAGATA 1020 

GTTGGTGGTC GAGTGCGGTA AAG AAG T TAG AAGGAAT TAG AATTTTAGTG TTTTATATTT 108 0 

ATTATTAGAT ATATTTATAT TTATATACGT TTTTAGATAT AT AT AAG AG T GTTTGTCGGT 114 0 

TAT AT T AAAT TTTATTATTA TTGTTTGTAG AAATTAATTT AAAAAAATAA TAATAATAAT 12 00 

AAATAATTTT AAAAAGGATA AAAAAATTAA TGATTGAGAA AAGAGGTATT TTTTTTTGAT 12 60 

ATTTGGTTTT GTTTGAAATA ATAAAAGAAG AAGAAAAATT TATTATTATT ATCGATTTTT 132 0 

TTGTTTTTTT TTTTTTTTTT TTTTATTTTG TTTGAAAATC GTGGGTTTGG GATTGTGAAT 1380 

TATTGTATGA TATTTAAAAA GAAAAAAAAA ATAAAAAAAA GTTGAATTAA AGGGTTTTTG 14 4 0 

GATAGGAGTG GTTTTTGTTT T 14 61 

ANGABEN ZU SEQ ID-NO: 10: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 2536 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandel te Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 10: 

AGTAGTAGTA GTAATCGGGT CGTCGTCGTC GCGGGGTTAA GAGATTACGT TTAGTAAAAA 60 

TTTTTTTAGG AAAGAGGTTC GAGAGTTTTT TTTTTATTTC GTTAAGGGTG TTGATTTTGT 120 

CGCGTTACGT TACGTATTAA AAGGTTCGCG AAGAAAAACG CGGGCGAAGT TTAGTATTTT 18 0 

C G AAT AG AAA GGGAATTTAT TTTAGAAGGG GGGTTTACGG GTTTGAGGGT TTTTGGGTGG 24 0 

GGAAAGTAGT ATTGGAGGGA GAAGATAGAA GGGATGGTAA GATAGAGGAA ATTACGGGGA 30 0 

TAAAAAGGAA GGGATGAGGA GTTTTTTTAT TATAAAAGGG ATTGACGGAC GGGATGTAGA 3 60 

GTAATGGGTT TTTTTCGAAA AATGGATTGG TAGGTTTTTT CGTATTTTTA AATAATTTCG 420 

TATTATTTGA AAGCGGGGAG TTTGAGTTTG GGGTTGCGTA GATTAAAGTA GGGTAAGACG 480 

AAGGGAAAGA GGGAGGGGAG TTTGGAAGTA AAGTGAATAA AGAGGTAAAA GAGGTAAAGT 54 0 

TGGAAATGGA AACGAGAAAG GGAGTTGGAA AGGGGTCGTT TTGGAAGGGT TTTGAAAAAG 60 0 

GTTTAGAAAT GGGATGTTGG GGAGGTAAAG GGGGATAGTT TCGAGGAAGG GTATTTTAGG 6 60 

AATGTAAGGG AGCGTTTTAG GTTTTGGGAA GAGGAAGGGA TGGGAGGGCG GGGAGGTAGT 72 0 

CGAGGTTCGG GAGTTGGAAT AGAGGGGGTT TTGCGCGGGG TTTAGGAGGG GAG AG TAG GG 78 0 

TCGGAGGGAG GCGATTATCG CGGGAAGAGT TAGAGGATGG GAGGGAGGGG TGTTGCGGTT 84 0 

GAAGAGGGGA TGTGGATTTT TTTAATGTTA GGGAGAAGAG GGAGGTGAAG C G AG AT AAAA 90 0 
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GGAAAGGGGC 
GGTCGTGGGA 
ATTTTAGGTT 
TTTTCGGTTT 
ACGGTTTATA 
GGTAGCGGTA 
TCGCGGGTCG 
TGGTTTTTTG 
CGTATTTTGC 
GTTTATTTAT 
GATATAAGTT 
AGAGAT AT T T 
T AAAT AT T AC 
ATTTGAAGGG 
TAATTTCGTT 
TGTTTAGTAT 
GTATTGGAAT 
ATTTTATTGT 
TTAAAATAGG 
GTGTTAGTTT 
GGGTAGGAAT 
AGTTTTTTGG 
GATTTTTTGT 
TTGTTTTTTG 
TGGTTTTAGA 
ATGTTGTAAT 
AGAAATTAAT 
TTTTGGTTTT 



GAATAGGGAG 
AGCGGTCGGG 
GCGGATTTTT 
TTTCGTTCGT 
GCGGCGGTTT 
GCGGTAGCGG 
AGTTTTTTAG 
CGTTTGTTTT 
GTTTGCGCGC 
AATCGCGTTC 
TAGTTAAGTT 
GGACGCGTAT 
GGGTCGTAAG 
TTGATTTTGT 
ATTGATTGGA 
TAAGTGTAGG 
TGTTTATTGA 
AG TAT G AAAT 
TTAATGTATG 
TTATTATAGA 
TGTTGTTTAG 
GTTTGGTAAG 
AATTTTTATT 
T T r X 1 T T T T T T 
TGTTGAAAGG 
TATATTGGGT 
GTATTGTAAT 
TGTTTT 



AAGAGGAAGG 
GGGCGCGGGG 
TTTTTGGGGA 
TTTTTCGTTT 
TTTTGCGTCG 
TTCGGTTCGT 
TAGTCGGCGT 
TTTCGTTTTC 
GGTTTAGTTA 
GCGGAGTGTT 
TATATAGTTC 
TGTGATAGGC 
CGTTTATATT 
TTCGGTGTAT 
TTAGATTGTA 
TATTTAAATT 
GTATTTGTAA 
TAAATGGTGT 

r^r rj*i rj\ rj\ rji r^i r^i rji 

ATGCGTAATT 
AATATATAGT 
ATTTTTTATT 
TTTATTTTTT 
CGTTAGTTTT 
GTTAGTGTAT 
TATGTTGAAA 
TTCGATGTTT 



AGTTTGCGAC 
ATGGGAAGGG 
GCGGCGTTGT 
TTTTCGGGCG 
AGTTTCGGAT 
ACGGTTATTA 
CGGCGTCGGC 
GGCGTTTTGC 
GCGCGGCGCG 
TTTCGTATCG 
GGTTCGGGTG 
GTTATTTTGA 
TATATTTATT 
TCGTAGTAGT 
AATTTTTTGG 
TTTGTGGAGT 
TAATTTTGAT 
TTGTGTGTTT 
TTTAACGTAG 
TTATTTTAAT 
TTGAAGTATA 
TTTTATTTGT 
TTGTTTTTTA 
TGGGGAGTTA 
ATAGAAGATA 
TTGTGAAGTT 
GTGTTGAGGA 



GCGATGGGGG 
GTCGGGCGGG 
CGGCGGGCGG 
GCGGCGGGGG 
GTTGTTTTTG 
TCGTTCGCGG 
GGCGGCGGCG 
GGCGGTCGCG 
TTTTTTTCGC 
TTTTCGGTGC 
GTTATGGAGA 
TATACGTGTT 
TGTAGGGATT 
AATGATGCGA 
CGTTTGGGAT 
AAGTGATTGG 
TTTATGGTTT 
GTTTTGTTTT 
AGGAGTTTTA 
TTAAATGTTT 
TTGTGTGTTT 
TTGTTATTTT 
TTATTATTAA 
GTTGTTATGA 
TATATTTAGT 
TTAATTTTTT 
TTTTTTTTGT 



AGGGGAGGGA 
CGGCGTGGTT 
GTTTCGTAAT 
TCGGTACGGT 
GGGAGGCGGA 
TAGTAGGCGT 
GCGGCGGTTA 
GTTCGATTTT 
GCGCGTTCGC 
GTGGGCGGGA 
GGCGTATTGT 
TTTTTATTTT 
ACGTGGGAGA 
GAATTCGTTT 
GGTTTAGTCG 
ATGAATGAAT 
GGTATAAAGA 
GGTTTAAGGT 
TTTTGTTTTT 
ATATTTTTTA 
ATATAACGAT 
GTTTTATTAC 
AATTTTTTTA 
GTATTTAGTT 
GATGGGTAAG 
TATGTGTAAG 
AAATTTAAGT 



960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2536 



ANGABEN ZU SEQ ID-NO: 11: 

SEQUENZCHARAKTERISTIKA : 
LANGE: 504 Basen 
ART: Nukleinsaure 
S TRANG FORM : Einzel Strang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelt e Genom-DNA 



SEQUENZBESCHREIBUNG: SEQ ID-NO: 11: 



AGTAGTAGTA 
AGGTCGGCGC 
AGGTTGAGAC 
GGCGGCGGAT 
TGCGTATTGT 
TGTTAGTTTT 
TTCGTTCGTT 
TCGGGCGGGG 
TTAAATTTAG 



GTAGCGCGTT 
GCGTGAGTAG 
GCGTTTTAGA 
TAGCGGGCGG 
GTCGTCGATG 
CGCGAGAATT 
CGTTTTTTTT 
GTCGGGAAGT 
GAGGTTTTTG 



GAGTTCGGTT 
CGGTAGCGCG 
GTTCGGCGGA 
CGGCGTCGGT 
TCGGTTCGGG 
TCGGTTCGTT 
CGTTTTTCGG 
GGTGGGAGAA 
TTTT 



ACGTAGAGCG 
AG TAT C GAG G 
GTTCGCGTCG 
TGTAGTTCGG 
AAGGGTAGTT 
TTGTTGTTGT 
GGATATTCGG 
GTCGTCGTTC 



TTAGTTCGGT 
CGTTTAGTAG 
CGTAGTTCGT 
AGAAACGCGT 
GTTCGTAGTT 
TCGGAATTTG 
GTTTTGAGTT 
GCGTTTGTTT 



GCGGTTTTGT 
GAAGGTGGCG 
TATGGCGTCG 
CGGTTGCGTT 
GCGCGTCGTT 
GCGGGAGCGT 
AGATTTTGTG 
AAATTTAGTT 



60 
120 
180 
240 
300 
360 
420 
480 
504 



ANGABEN ZU SEQ ID-NO: 12: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 2036 Basen 
ART: Nukleinsaure 
S T RANG FORM : Einzel Strang 
TOPOLOGIE: linear 



ART DES MOLEKULS: chemisch vorbehandel te Genom-DNA 



SEQUENZBESCHREIBUNG : 



SEQ ID-NO: 12 : 
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AGTAGTAGTA 
TAGAGATTTT 
TTTCGGTTTT 
GTTTTTATTA 
CGTTGTCGTC 
GTTTTTTTTA 
ATGTTAATTT 
ATTATTAGTA 
TATAGGCGTA 
CGTAGAGGAG 
CGTTTTCGGC 
GGAATACGTA 
TGTAGGCGGG 
TGTTTTTTTC 
CGTCGTTTAA 
TTTTTCGGAT 
ATATATTTTT 
CGTTTATATT 
TTTTTTAGGG 
GAATCGTATT 
TATGGTGTTT 
AAGGTGTCGG 
ATATTTTAGG 
TTATTTTGAT 
TGCGTATGTT 
ATTATTAATA 
TAAATATTTA 
TTTTTATGTT 
ACGTGATTTT 
AAAGTTGTAG 
AATTGGGTAA 
AAATGTTAAT 
TTATTTTTGT 
TATTTTGGGT 



GTTTTAATTT 
TAAGTCGGAG 
TAACGGTTCG 
GTTTTTTTAG 
GTTTTTCGGT 
GGGGATTATT 
AGTTTTCGGA 
GTCGTCGTCG 
GTTTTCGTAG 
CGTCGTCGCG 
GGTTGTAGTC 
TTAAAGCGTG 
TCGGGATTTT 
GTTTAATTTT 
GTTTTTTCGC 
CGATAATGGT 
TTTTTTTGTT 
TAAAAAGGGT 
TTGTTTTATT 
CGTTTTTTTA 
GTATTTTTTA 
TATAGTTTTA 
TTATGTAATT 
TTTATTTTTA 
TAGTTAAATT 
AT AAT TAG T A 
TTATTGTGTA 
ATTTAGAAGA 
TAGAGTTATA 
TGTTTTTTAT 
AGTGAAAGTT 
GAAAAATTTA 
TTTTGTTTTT 
TGGAAAGGCG 



GAGTTTAGCG 
GAAAATAGCG 
GATAAGATGT 
TAGTCGTCGT 
AGTATTTGGT 
TTAGTTAACG 
GGTATTTTTT 
TTTGCGTTCG 
TAGCGTCGTT 
GCGTACGGTT 
GTTGTTGTCG 
AATGTAGTTT 
CGTCGGGCGG 
ATTTCGTCGT 
GCGGTTTTTT 
AATAATTTGT 
TCGTTTTTTT 
AGTAATGTTT 
ATTAGAGGAT 
GGG TAGAAGA 
TTTTGATTTT 
GGATGAGTAG 
TTGAGTTTAG 
AAGAGGTTAA 
AATGTGAATA 
TATTGTTTTT 
AGGGAAGGAG 
AGGATTTTTT 
TTGTAATGGA 
TAGTTGGGTT 
TTGTAATTTT 
GGATGTGTTT 
TGATTTAGTT 
TAGTGCGGGT 



TATTCGAAGT 
TAGTGTCGGT 
AG AT G GAAT T 
CGTTTTAGGA 
TTACGGGTAT 
GGATTATGTT 
TTTCGTAGAT 
CGTCGTAGTC 
TATTCGTTAG 
ATTAGTTTAT 
TAGTCGTCGT 
GGAGCGTATC 
TCGGTGTGGG 
TTAAAAAGTT 
TTATTTTTAA 
TGTTATTTTA 
TGTTATTTTT 
AGTTTTTTTT 
GAGGTTGGGA 
AGTTTTTTTT 
TTTTGATAAG 
GTTGAGATTT 
GGTGTCGTTT 
TAATTTTTGA 
TATGTGTTTA 
GTTGGGAAAA 
GTGGAAGAGT 

GTTTATTTGT 
AAGAAAATAT 
AATGAAAAAT 
TAGATAAAAA 
TATAGTTATA 
GTGTGTTTAT 



TTCGTTTACG 
TTTTAGTTTA 
ATCGTTTTTG 
GTTCGCGGTA 
TATTAACGCG 
TTTTTAGAAT 
CGGTTTGGCG 
GGTATAGTTA 
TTTTAGTTAG 
TATGATTAGT 
TTCGTCGGTT 
GTTTAATTTT 
CGTGGGTGTG 
TTTTTTTAGT 
GTTTTGGATG 
GGTAATATTT 
TTGATTTTTA 
TTTTTTTTCG 
GAATATTGTG 
TTTTAGTTTA 
TAAAGTTGTA 
TTATTATTTT 
GTAAGCGGTT 
GTGGTGTTAT 
TGTTTCGTTA 
TTATGAGTGT 
GGAAATTTTA 
CGGAGGTAAG 
TAGTTAGTAT 
AGATTAATTA 
GAGTTTTGTG 
GGTTGAAATG 
GTAATTGGTA 
AGGCGGTTTT 



rj\ rpi rp rpi r^i rjy rj\ rp rji rji 

GTCGTTGTTT 
TTAGGTTTGA 
TCGGGCGCGT 
GTAGAGGATA 
TTTTCGTATT 
TAGATTTAGT 
GCGTAGTTAT 
GCGTTTTACG 
AAGTCGTTTT 
TCGTTTAGTT 
TGGGGCGGTT 
GGTGTCGGGG 
AACGTGATCG 
GAG GAT AAC G 
TGTTGTATTT 
ATTATTTATT 
AAGTTTTTAG 
ATTATTGGAG 
T T T? T T r J_ 1 T T T T 
AGTGTGTGGT 
GAG TAG T TAT 
TATATTTAAA 
TTTAGACGGT 
AGGTGTTAGA 
GAGATTTTAA 
AGGGTAATTT 
AGATAATAGG 
TGAAATATTT 
TATTATTTGA 
TTTTGGTGTT 
AAGAGTGTTT 
GTGTTTTGGG 
TGTTTT 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2036 



AN GAB EN ZU SEQ ID-NO: 13: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 4 52 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzel Strang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandel t e Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 13: 

AGTAGTAGTA GTAATTTTTT TGTATTTGTA GTAGAAAATT TATTTTAGAG ATTGGGTATG 60 

TGTGTTAAGG AGATGGTGAT TTTTTTTGGA TATTTTAGAG ATTTTTTTTT TTGTTATGAT 12 0 

TTTTATTCGG GGGATATTTA TATAATGTTA TTTTTTTTGA TTAGTTTTGT TTATATTAAG 18 0 

ATTGTTATTT TTTTAGTTGT TTGTGTGTTT TTAGATTATG ATATTTATTT AGTTGTTTAG 24 0 

TTTAGGAAAG ATTTTTGGGT GTATAAATTA GTTTAGAATA GTTGGTAGTA ATTTGTAGAT 300 

CGTTTGTTGT GTCGTGAGGG TATGGATGTG GTATATTTTA ATGGTTATAT TTATATTTTG 3 60 

GGGGGACGAG ATTTTATTAT TGGAGTTAAG TTGAAGGAAG TGGAATGTTA TAGTGTTTAG 420 

AGAAATTAGT GGGTATTGGT GGTTTTTGTT TT 4 52 

ANGABEN ZU SEQ ID-NO: 14: 



SEQUENZCHARAKTERISTIKA: 
LANGE: 513 Basen 
ART: Nukleinsaure 
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ST RANG FORM : Einzelstrang 
TOPOLOGIE: linear 



ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 



SEQUENZBESCHREIBUNG: SEQ ID-NO: 14: 



AG TAG TAG T A 
GGGCGAGCGG 
TTTCGGGCGC 
GAGGGGCGGG 
CGGTTTTCGC 
TTCGCGGTTG 
T AG AG AG AG G 
AAAGGGCGAT 
TGTTTAAGGG 



GTAGCGGAGA CGGAGGCGGC GGCGGAGGCG 

CGGGGTTTAT GGTCGGATTC GGCGAGTTGG 

GGGGGGGATC GGAGGGAGCG AGGTCGTTGT 

GTCGCGGTCG GACGGGGCGG GGTATTAGGA 

GTTTAGATTG GGTCGCGGGC GTTTTTTGGT 

AGGGAGTTGG AGAGGGGTAA AATCGGGGTC 

AGGTGTTTCG GTAGCGGACG CGTTAGCGGG 

TTGGGGGAGT AGAGATACGA TTAGAGTTTG 

GTTTGGTGGT AGGTTTTTGT TTT 



GCGGCGGCGA TTTTAGCGCG 

TTTAATAGTG GGGTTAGGGG 

CGGACGGGGC GGGGCGTCGG 

GGAACGGAGT GGGCGTTTGG 

GGTCGCGGAG AGTTTAGGTG 

GTAGCGGGAA GGCGGAAAGT 

G TAG AT AG G A AAATAGTTGG 

AGAAGGGTAG GAGTAAGGGA 



60 
120 
180 
240 
300 
360 
420 
480 
513 



ANGABEN ZU SEQ ID-NO: 15: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 98 0 Basen 
ART: Nukleinsaure 
STRANG FORM : Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 15: 

AGTAGTAGTA GTATTTTCGG TTATAAGGAT TTTTCGAGTT TCGTTCGTCG GTCGCGGATT 60 

CGGTTTTTTT TTTTTCGGTC GTTAGGGGGC GGGTTCGGAT TATAGGATTG GAGTTGGGCG 12 0 

GAGATTTACG TTCGGAGCGG TTGTGAATTG GTAGGCGGTG GGCGCGGTTT TTGTGTCGTG 18 0 

TTTCGGGTAT TTAGTTTTTT AACGGGGTTT CGGAGTCGAA GATAGTTTTA GGGTTTAGGG 24 0 

AGCGCGGGCG GTTTTTGGGC GGCGTTAGAT TGCGGTGAGT TGGTCGGCGT GGGTTATTAA 300 

TTTAATGTAG TTTAGGGCGG CGGTACGAGA TAGAATAACG GCGAATAGGA G TAG G G AAAG 3 60 

CGTTTTCGAT AGGTTAGGTT TAGGGATTTG CGGGGAGAGG GCGAGGTTAA TATTCGGTAT 4 20 

GGGTTTTTGA TTGGTTTTTG GGATTCGTTT CGTTTACGTT TATAGGTGGG TTCGTATTTT 4 80 

TTTTTGCGTT TCGTTTTCGT TTTAATAGTT TATAGTTGTT GTTAGTTTAT TCGTACGTTT 54 0 

CGAATTTCGT TCGAATTCGT TATTGGTTGT TTTTTAGCGG TTTGTGTTGA TTGGTTGTTC 600 

GAAGATTCGT TTTTTTGTCG TGGGTTTAGT TTCGTAAATG CGTAGTTAAG CGGGTGGTAA 660 

GGGGCGGGTG GAGCGCGGGG CGCGACGGCG GAGGGGGGCG TGGGTAGTCG GACGTATTTT 720 

GGTAGGGAGT AGTAGGTGGC GGCGGTGTAT GGGGTTTGGT TTTATTAGCG GGTATTGGTT 78 0 

TATAGTTACG GTCGGGGGGT TATTTAGTTG GAGAGAGAAG GGATAGGTGA TTCGATCGGA 84 0 

GTTTAGTTTA GTTTTTAGCG GTGGGGCGAG AGATAGCGAG GGGAATCGAG GTTGGGGAGG 90 0 

TTATTTAGGG AGATTTCGGA GGGAATTTGG TGAGGTTTGA ACGGAGGGAG ATTTGGGGTT 960 

GAATAAAGGG TTTTTGTTTT 980 

ANGABEN ZU SEQ ID-NO: 16: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 223 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 16: 

AGTAGTAGTA GTAATATTAT TTTATTAAAA AAATATTAGC GTAGTTTTTA ATAGAGTTTT 60 
ATTTTTTAAA GTGAAGTTAA AAATAGGTTT TATGTTTAAA GTTTTTTTTC GTAGTAGGCG 12 0 

ATACGCGTAG AT GGAGAAAA TATTTTTATT GTTGGGAAAG GGAGGCGTGT TAACGGGGAC 18 0 
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GAAGGATATT TTATTATTTG GTAAAGTTAT TGGTTTTTGT TTT 223 

AN GAB EN ZU SEQ ID-NO: 17: 

SEQUENZCHARAKTERI ST IKA : 
LANGE: 1145 Basen 
ART: Nukleinsaure 
STRANG FORM : Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 17: 

AG TAG TAG T A GTTTTGGGTT TCGTTTAGTC GTAAGATGAG TTAGTTGGGT TTGGTGGGGG 60 

TTGTATTTAG GTTACGTTTT TTTAGATTCG TTTTTTTTTA TTAGATTACG TTTATCGTTT 120 

TTTAGTTCGT TTTTGGTTTA GGTTTTTTTT TGTTTTTTTC GTTTTGAATT TTGTTTCGAG 180 

TTTCGTTTAT TTTTTTCGGT TTTTTTTAGT TTTGTTTTTC GGATTTTGGT CGAGTATTTT 24 0 

AAGTTTTTTT TTTGGCGATT AGGTTTTTTT ATTATTTAGG GTTCGTTTTT GTTTGTTCGT 300 

TTGGGGCGGT TTGTAGTTTT ATCGTCGAGG AAGAGGAAGG CGTTCGTGGT TTGGTTTCGT 360 

AGCGATTCGT TTTCGTCGTA TCGAATTCGT AGTTTTATTA TTATGTTTAT TACGTCGATA 4 20 

TTTATCGTTA GTATTATGTA CGTTATAGTT ATCGTTAGCG TGGTTGGGGA GAGCGGGCGT 4 80 

ATTAGTTTTC GCGGGCGTCG TTTTAGTTAT TACGGGTTCG GTCGTAATCG GAAGTTTTTT 54 0 

CGTTTTTTGT TTTTAATTCG GTGTGTGGTT AGGAGTCGAG TTTTATCGAT CGGGAGTTAG 600 

GCGTTTGGAT TGAGATTTGG AGGTTATATT AGGATTTGCG GTTATTGTCG TTATTAGGAC 6 60 

GGGGAGGGGG TCGGGGATAA GTTTATAAGT CGAGGGGCGG GGTTCGTGGC GGTTTCGGTC 72 0 

GATAAGGGAT AGTTGTAATT GAGTTCGGGG TGGAAGGGGT GGGCGTTTCG TTATGGGTTT 78 0 

AGTTGTGTGT TTCGAGTTTT GGGGGTTTGA AATGTTTTTT GATATTTGGG CGGGCGGAGT 84 0 

TTTATTTTGG TAGGGGATGT TGGAGTAGAT GTCGTGGTTG TATTTTTGTT ATAGGTTATT 900 

GTGGTTTTTT TGTTGGCGGG TTTAGTAGTT GGTGGTCGTG GAGAGTATTA TGAGGACGTT 960 

GGTTACGAGG TTGAGTAGAA TGTTTTTATT TTGGAGGTTT CGTTTTATTT TTATGTTATT 1020 

GAGGTTGTAG TCGGGGGTTA TAAGGGTAGG ATGGGTTTAG GTTTTTTTTA TTTCGAGGTT 108 0 

TTTAGTTGAG GAGTTCGTTT TTTTTATATT TTTTTTTTGG TATTTTTGTT TGAGGTTTTT 1140 

GTTTT 1145 

ANGABEN ZU SEQ ID-NO: 18: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 633 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 18: 

AGTAGTAGTA GTATAGTTCG GCGTTGGTTA GCGGTTTAGA GTCGGGGTAG GGAGGGTTTT 60 

CGTGCGGACG GGGGTTAAGA GGTCGTTTTT AGTTCGGGGT AGTTCGCGTA TTCGAGTTTG 120 

GAGTTCGGAG TTTGGAGGGG TGGGGAGGTT TCGCGTTTAG GGTCGGATCG GAGGGAGAGG 180 

GAGAGCGGTG GTTTTTTTTT CGGTTTTCGT CGTTAGTCGA TCGGGGCGTT GGGCGGGCGT 240 

CGCGGGAGTC GTAGTTTTTT TCGGGGGGCG GATTCGGTTT CGGCGGCGGT ATTTAGTTTT 300 

TGTTTCGATA GGTGCGCGTC GCGCGAAGGA ATGTAGTCGG TTTGATTTAT TAGCGTTTTT 3 60 

TTTTTATTTG CGCGTTCGTT TTATAAAGCG TTGTTCGTTT CGTTTTTATT TTTTTAATTT 420 

TCGCGTTCGT TTTCGGATAG TTTTTGTTCG TTCGCGCGTT GTAGTTTTAT TTTTTAGCGG 4 80 

TAGTTTAGGC GCGGAGGGAG CGAGTTCGTT TCGAGGTAGG TTTAGGACGG GCGTATAGTA 54 0 

GTAGTCGAGG TTGGTCGGGA GAGGGTGAGT GTTCGTTTTA GTTGGGTAGT CGCGTAGGGG 600 

AGTTGGTCGG GTAGGGTCGG TGGTTTTTGT TTT 633 

ANGABEN ZU SEQ ID-NO: 19: 



SEQUENZCHARAKTERISTIKA: 
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LANGE: 12 Basen 

ART: Nukleinsaure 

ST RANG FORM : Einzelstrang 

TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandel t e Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 19: 

AGTAGTAGTA GT 12 

AN GAB EN ZU SEQ ID-NO: 20: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 12 Basen 
ART: Nukleinsaure 
STRANG FORM : Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelt e Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 20: 

ACAAAAACTA AA 12 

AN GAB EN ZU SEQ ID-NO: 21: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 7 4 Basen 
ART: Nukleinsaure 
STRANGFORM : Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelt e Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 21: 

AGTAGTAGTA GTTTCGGTAG TTTAGTTTAT GGCGGCGGTG GCGGCGGTAG TAGGTTTGAG 60 
TTTTAGTTTT TGTT 74 

ANGABEN ZU SEQ ID-NO: 22: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 103 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 22: 

AGTAGTAGTA GTAGCGGTAG CGGTAATAGG GCGGTTGAGA ATTCGGCGGC GGCGTTTTTT 60 
TTCGTTTTTT TTTTTTTCGT TTCGTCGATT TTTAGTTTTT GTT 103 

ANGABEN ZU SEQ ID-NO: 23: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 55 9 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 
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ART DES MOLEKULS: chemisch vorbehandelt e Genom-DNA 



SEQUENZBESCHREIBUNG: SEQ ID-NO: 23: 



AGTAGTAGTA 
GGTTTTTTAG 
GGGAAAATAA 
TTAATTTTTG 
TTTTTTAGAT 
ATAATAGTAT 
GTTTTTGAAG 
GGTGAGGGGC 
TTTTTATATT 
TATATTTTTA 



GTAAGAAGGA AAAAAATAAA TTTTTTAAGT 

TTTTATTTCG GTATAGTTAG GGTTTTTAAT 

AAAGTTAAGT TTATTCGTAT TTAGTTAAAA 

GTTTTAAATA AATTATTTGA TGGTGTTAGA 

AAGGGTTTAT TTTACGAGAT TATTAAGTAT 

TTTTTTTTTT AT C GAG GAT T ATAGTATGTT 

AGATATTTGG GAGTTTTTAG AAATTAAAGG 

GTTAAATAAT TTTGATTTTT ATGGTTGTGA 

TAATAATATT GAATTATTTA AACGGATTAG 
GTTTTTGTT 



ATTTAGTGTA GTTTTTTTTG 

TTATTTTTGT TTTGGGTTTA 

GTTGAAAATA AGTGGTCGGA 

AGGTAATAAA TTTTATTTTT 

TGTTTCGTGA GAT TAT T G AA 

TTTGATTTAA AACGTTTTAA 

AAGGATTGGA AATGTTAGGG 

TTGATGTTGT TATTAGATTA 

TATAAATTAA AT TAT GAT AG 



60 
120 
180 
240 
300 
360 
420 
480 
540 
559 



AN GAB EN ZU SEQ ID-NO: 24: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 1695 Basen 
ART: Nukleinsaure 
STRANGFORM : Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelt e Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 24: 

AGTAGTAGTA GTTTTGGAGA GTAAGTGGGT TTTATGTAAA GTGTTATTTG TTATATATTG 60 

TTATTTTTAN AGGATTTTAG AATATTTTCG AATTCGAAAA TAGAGTGAGT GTGGAGGGGA 120 

GGGGGGTGTT TACGTGGAGG AGGGTCGCGA GAAGGAGAGT GCGTCGGGTT GATGGTTAGC 180 

GGTGTTTCGG GGGTCGATGT CGGGCGGGAT CGGCGGCGCG GGGGTGGGGC GACGGCGGGG 24 0 

CGGCGGTCGA GTAGTAGAGG GGCGTTTCGT AGAGGTCGGG GGGGGCGCGG GGTTTCGCGT 300 

CGTTTTGTTA GTAGTCGTTT CGTCGTTTTT TTCGGTTCGT TCGTAATCGT CGCGGGATTC 3 60 

GTCGGTTCGG GTTTTTGGAA TTTTTTACGG GGGATAGTCG ATCGGGGGCG TCGGGGTTCG 4 20 

TTTTCGTATT CGATTCGGAC GGCGGTAGTA GGGGGAGGGA TGGTGTATCG AGGAAGTTAA 4 80 

GGTTTTATTA TTTTGTTCGG CGGGTCGGCG GTTCGTTGGT TCGTTGGTTC GGAGAAGTGT 54 0 

TGCGTTTAGG TTGGTTCGTA GGAAACGGCG GCGGCGGTTT ANTTNTANTT TTNNNNTTNT 600 

TNNTTGNNAN TNTTTTTTTA TAGGGGAGGG GTAGGCGGTT CGCGGGTTTC GCGTCGGTCG 6 60 

GGCGATTGGG TACGCGAGGG AGCGGGTAGG GTAGGGGGAA ATAAATTAAG GTCGAGATTT 720 

AGAGTCGGAG AGCGCGGGAG GAGTAGCGGC GAGAGGTAGG AGAGGTAGAG AAGAAGAAAG 7 80 

GAGGGAGAGA GGGGGCGAAG ACGGTCGGGA AATTCGGGGT TGTAGTTTCG CGTCGCGTCG 840 

GAGTCGTGAC GGATTTATTG TAGCGGTCGC GTTGATTCGT AATTTTAAGG TACGAAAAAA 900 

GGGGAGGGTA GAGAGGGAGG GGAAAGCGGA GTGTTGTAGC GTCGGGGCGG GGGCGGGTTT 9 60 

TCGCGAGCGT CGTATATTCG GGAATTTGTN GTTTCGTTGC GGGCGAGTGT CGCGTGTTTT 1020 

GGCGAGTTTT GGTTGGGGAA NTTTGAGCGC GCGGATTACG TTCGTTTTTT AGTCGGTCGT 1080 

TTTTTGCGTG TAGGGTGGGG GGAGGTTAGG GGCGGGGGCG CGGACGTCGG TGACGTCGCG 114 0 

TGGCGGAGTT TTTTCGGTTA TGTGGTTGGA GGCGGGCGGG GAAGAAGGTA AGGTTGGGAG 12 0 0 

GGGAAGGAGG AAATGCGAGG GTTTTTCGGC GGGAGGAAGC GCGAGGGGTG CGCGAGTGTT 12 60 

AGCGAAAGGG GGATAGGGGT TTTGGAGTGG AAGTTTTGCG G GAG AG GAG G AG T AG AGGAG 132 0 

TAGTTTTAGG GTGTTAGAAT TATTCGGATG TCGTATTAAA AAATAGGAAA AATTTAAGTT 138 0 

TTGCGAGAGG TAGTTAAAGG TATTTGTGTA TTCGTGTATC GATTTGGATT TAT T AT AGAA 14 4 0 

TTGTACGGTT TATTAGGATT GTTGTTATTT CGGTGTAGTA TTCGTAGGTT TATTTGTAAT 1500 

ATGAATTGGT AGAGTTAGGA ATTAGGTTGT AAAGATAGAG AAGCGAGTTA AAGTTGGTCG 15 60 

TAGTTCGAGG CGTGGGGAGA ATTTGGGTAA AC GAGG AG AA GGGATATTTT TTATTCGTAG 1620 

AAAGATTTTT TATTTAGTTT TGTATTTTTA TAAATCGTTT AGATTTTTTT TTGGCGGAGT 168 0 

TTATTAGTTT TTGTT 1695 

ANGABEN ZU SEQ ID-NO: 25: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 722 Basen 
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ART: Nukleinsaure 
ST RANG FORM : Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 25: 

AGTAGTAGTA GTTTCGTTAC GAATACGATT AGTTTATATT 

AGTTTTTGTG GGACGTTGGC GCGTATATCG TTTCGTCGGG 

TTCGGGGTCG AGGACGAGGG AGGCGAGTAG GTCGTTGGTT 

GCGTTTGTAG TTGTTCGGGG CGAGGCGGGC GATTTTAGGT 

TTCGCGTTAA GTTTGGTTTC GGGGGTGGTT GTCGTCGGGT 

TTGTTTTTGT TTCGACGTTT TTGTTAATTA GTATTTTTTT 

TTATTTTACG TTTTTGTTAA TTTGTTTTTT TTTTTGTTAT 

TTTTTTTGTT TTTTCGTTTT TCGTTAAGGT ATTATTTTGT 

TTTGTTGATT TGGGATTTTA CGAGTTTTTT TGTTCGTTGT 

GGGTAGTTAT TTGTTTTTTT CGGGATTTAC GCGGATAGTT 

ATATTGGTTA GTTTTGTCGC GATATTAGCG CGTNTTTTCG 

GTTTTCGTTC GTCGTTTGTA GTTTTTATTT TTGAGTCGAC 
TT 

ANGABEN ZU SEQ ID-NO: 26: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 517 Basen 
ART: Nukleinsaure 
STRANGFORM : Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 26: 

AGTAGTAGTA GTTCGAATTC GCGCGCGTAG CGGCGTATGG TTAGGTTTAG CGAACGTAGT 60 

TTTAGCGAGT GGCGCGTTAG GCGTATTACG TAGAGTACGC GTAGCGTACG TAGTAGTCGT 12 0 

AG TAT TAG TT TCGCGCGTTT TAGGAGTTTG GTTTCGTTCG GGTTTGTCGT TAGTTTTAGT 18 0 

AGTAGCGATA CGTAGAACGG TAGGAGCGTT AGGATGTTAA TGATGTTGAG TGGCGCGCGT 24 0 

AGGAAGGCGT ATTTGTTTTC GGTTTGTAGG GAGCGTAGTA GGAATTCGAA GGAGAATTAG 30 0 

GTTACGTATA CGGTTTTTAG TACGAATAGG TTGCGGTATT TGGGGGAGTA TTCGTTTTGC 3 60 

GGGGAGAGGG GATACGGGGT TGGGGGCGTA GGTTTTTTGG AGGGTCGGGG GCGTTTTGTT 42 0 

TTTTTTTTTT TAGGATTAGA GGCGTTTTTT AGGTTATTTT TTTCGTTTTA ATTTACGGAA 4 80 

GCGGGTGTAG GGGATATTGA TAGGTTTAGT TTTTGTT 517 

ANGABEN ZU SEQ ID-NO: 27: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 1078 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 27: 

AGTAGTAGTA GTATTAGTAA TAGTAGTACG AAAAGTAAAA TTGTAATTTA AACGGTTTTT 60 

AGGGTTTAAG TAGGTTCGAC GAAGATTCGT TTATTCGGTC GTTAGAAAAT TGGGAGTTTC 12 0 

GTTCGTTTTT TCGGTATTGA AACGCGATCG GTTTTGTTTG GTATCGTATT TTTTTTTTGA 18 0 

TTTTATTTAT ATTACGACGA CGGACGTTCG AGAACGTTGT ATCGCGTTTC GTAGGAAGTG 24 0 

TTTTTTTGGG CGGAAGTTTT TGAGCGTGAT ATAGCGGAAG TGTTTTTTTT TTCGGTTTTT 30 0 

TTGGTTTCGG TCGTAGAAGC GAGATGGTGA GTTGTGATTG TGGTGTTTGT GAATCGCGTT 3 60 



GGTTGTTTAG TATTTCGGTT 60 

GGGTCGGGGA TTTCGGGGAT 12 0 

TCGACGATTT TGCGATCGAG 18 0 

TTTCGAGTAT TTTCGAGATA 24 0 

TTCGTTTGCG TTTTTGGTTT 300 

TTTTAATTTT TTTTCGATTT 360 

TTTTCGACGT TCGTTTTTTT 420 

TTATTTATTT AGCGTTTTAT 4 80 

TTTTTATTGG GTAACGTTCG 54 0 

TTTCGTTTTT GATTTTTGGG 600 

TATTTTCGTT CGCGCGTTCG 660 

GTTCGTTTAT TTAGTTTTTG 720 
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TTATTTTCGT TTTTTGTGTT TTTTTGTTTG TTGTGTTTGG GGGGTTGGTA AGATTTCGGA 420 

TAAGGGGAAT TGGTGGGTTG GAAAGAGGTA TGCGGTGGTT TTTAAGAGTT AGAAGAATGA 4 80 

TTGTTAATTG GTGTTTGGGG GATTTATTTC GTCGTAATTG TGGTGTTAGA GTCGTATTGT 54 0 

GTTTTTTGTT TCGGTTTAAT TTTTGGAGAT TTTTTACGGT TTTAGTTTTG GTTGGGAGTC 600 

GAGGGAAGGA GTTTGGGAAT GTTTGGTTTT GTGTAATAAT GAAATAATTT ATTGGTGATG 660 

TTTTTTGGTC GGAGTTTGTA AAGATAAGGT GTATTTTAGA ATATTGTAAT TTTTGCGGAG 720 

GGTTTTAGGT AACGTGAAAT GCGGGTAGTG GTTTTTGATT TGGTATTCGT GGAAAGAGGT 78 0 

TTTTTTCGTA GTTTCGATTT TTACGATTGT TTTTAAATTT TATTAGTAAT TGGTTTTTCG 84 0 

GAGAATTCGA GTAAATTTAG AAGTTGTTAG GTTTTAGAAT TATTTATTTT TTTAATGTGT 900 

AGACGAAGGG AACGTTATCG TTTGGAAAGC GTCGTAATAA GACGTATACG TTGTGTCGTC 960 

GTTGTGGTTT TAAGGTTTAT TATTTTTAGA AGTCGATTTG TGGTAAATGT GGTTATTTTG 1020 

TTAAGCGTAA GAGAAAGTGT AAGTAATATT TTTTAGGTTA ATTGTGTTAG TTTTTGTT 107 8 

AN GAB EN ZU SEQ ID-NO: 28: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 2 94 9 Basen 
ART: Nukleinsaure 
ST RANG FORM : Einzel Strang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelt e Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 28: 

AGTAGTAGTA GTCGTAGGAG TAGCGTTTTG GGGAGGGGGG TTCGTTTTTC GGGGTGCGTT 60 

TCGTGGTTAT TTTTTTTAAN GGGGGTCGTG GTCGTTTTTT AGTTTCGGCG CGTTGGGTTC 120 

GTTTTAGCGG GGTTCGTCGG GCGGGGCGGG GATTTGTATT CGGGGCGTTT TTTCGGGACG 18 0 

CGCGGGTTTT CGTTTTTTTT TTTGTTTTCG GGCGAGTTCG GATTTTGTTC GGTCGCGGGG 240 

TTTCGTTTAT TTGTTAAGTG AAGGTTTTAC GGGAGATAAT AAAGAAAGAA GTTGTTTTTT 30 0 

TTTTTTTTAG TTAAATTACG GAT GAT TAG T AATCGGTTCG TTTTTTTTTT TGTTCGTTTT 360 

TTTTTTTTTT TTTTTTTTTT TTTTAGGAAT ATATTTTATT CGTTTTTTTT TAG AG T AG T A 420 

AAATTTTTTC GTTTTTGAAG GCGTGGTGTT GTTGGTTGTT CGCGAGTGCG GAGAGGGGAG 4 80 

GTTGGTTTTT GTTTTTTTTT TTTGGTTTTT TCGTTTTAAG TTTTGTTTTG TTTTAGGAAA 54 0 

ATTTTTTGCG ATGGTGTATT TTTTTGAAGT TGTTATTGTC GGAGTTTTTG GTTGTTTTTG 600 

AAATAAGAGT TTTTTTTTAT TTTTTTCGTA ATAGTTATAG TTTGATGCGA TATTTTTTTT 660 

TTTGGGTAGA AATTAGGAAA TAAATATAAT AAGGAAAAAA TTGAATAGGA AAAAAAATGA 72 0 

TGTCGAATCG TTTTGTTATT TTGTTGTTGA CGGTTGGGGT TGGTGTTTTA TTTTTTTTTT 78 0 

AGTAGTTGTT TGGAGAAGGA GGAGGAAGAA GAGTGTATTG GTGGAGGTGG AGGTGTGTGT 840 

GTGTATATAG GGGATCGATT TTTGATATAT AATAATTTTA GTGGGTACGT TGTACGGTTC 900 

GTAGAGTGTA TCGACGGCGG GCGTTGGCGT TGGTCGTGTT GGAGTAGAGT TGTAGTAGGA 960 

GTTCGTTTTG CGTTTTCGTT CGCGTTTTTT TTTTTTTTTT TATTTTTTTT TTTTTTTTTT 1020 

TTTTTTTTTT TTTTTTTTCG GGCGTTCGTT TTCGTTTCGA TTTGATAGTT CGTTTTTTGT 1080 

TTTTTTTTTT TAGAGCGGGG ATTGTCGAAT GTTTATTTTT CGTCGCGAGC GCGTATTTAT 114 0 

TATTATATTT TTTTAAATAT AAGGAAGTCG AGTATTAGGG TTTTCGTTGA TTGGTTATCG 1200 

TTGGGTGATT GGTAGGTTCG GAATGATTGG TTTAGGACGC GAGGTTTTTT TTTCGGTCGT 12 60 

TTCGATTGGT TGTTTTTTAA TTTAGGTAGA GCGTCGTAGA AGTTGGAAAT TTGTCGTTTT 1320 

TTAGTTTTTT TTTTTTTTAT TATTTTTTTT TTTTCGTTTT TTTTTCGTCG TTTTTTTCGT 138 0 

TATATTTTAA TTTTTAGTGT TCGGTTTAGA CGTTGGCGTT TTTTCGGCGG TTTTGGCGTT 1440 

CGTAATAGGT TTGGGCGGGG GGAAGAAAGG GGAGATAAAA GGGAGGGAGG GACGAGAGGG 1500 

GGGAAGAGAA TTAGAAGGAA AACGAAGGGG GAAATATGAA AAATAGTAAT TTGTTTATTT 15 60 

TATTTAGTAC GCGTCGGGTT GTTTATTTTT TTATTTTCGT TTCGTTAGAG ATTTGTAAAG 162 0 

CGCGCGGTAC GG AT G TAT T A TTTAAGTTAA TATTTATAGA TAGATGTGTT TTTAGTGGTT 168 0 

TTAAAGTTTT TTTTTTTTTT TATTAGTCGG TTTTTTTTTT TGATCGGCGG GGGTGGGAAG 1740 

CGGGGGTTCG TATCGTTAAG AGTTTTGGTC GTGGTTACGT TTTTTGGAAA TTCGTTATCG 1800 

TAATTTTTCG TAGTCGTTGC GCGTCGGCGG TAGTTTTTTT TGTTTAAGTT TTCGGATGTT 18 60 

ATTATTTGGG AAATTTGTAG TTTAGGANNT TCGGTGTTCG CGCGTGCGAG ACGGATCGTT 192 0 

TCGTGTCGTC GTTTTTTGGT TTTTTTATTT TTTTTTTTTT TTTTTCGTTT TTTTTTTTTT 1980 

TTTTTTTTTT TTTTTTTTTG GGATTCGTGT AAGTAGCGTG CGTGTTTTTG TGAGTTTGGA 204 0 

GGGTGTCGGT TAGCGGAGTC GTGCGATGTA TTTGAAAAGT AATTAGTTCG ATTTTTTTTT 2100 

ATAGAGTTAT CGTAAGTGTA TTCGATTTTA ATGGTTTTAG AAATTTTTGT GGTATTAGGA 2160 

TTCGGTCGAA AGAACGGGGA TCGGTTATTC GCGTTTTTTT TTGTTTTATC GTTTTTTCGT 2220 
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GTGTGTGTGT GTGTGTGTGT GTGTGTGTGT GTGTGATTAG CGGTGGGGGG GTTTGTTCGT 2280 

TTTTTATTTT TAGGTATGGT GGTGTTTTTT TTTTTTTTTT TTTTGTTTTA GATGGATTTG 2340 

CGTGGTGGAT GGGGTTGGCG GCGATAAATG TTTTTTTAGT TTTAATTTAG TTGAAAGAGT 2 4 00 

TAAGGGGGAT GGGAGGGGGA GTGTATTCGG TAGGCGAGAG AAGCGGGGGT GGGGTGGGGT 2 4 60 

GGGGTGGGGG GACGCGGTTA AGCGGAAACG TTGTATAGAG GAATTTTAGC GAATTAAGAA 2520 

AAAAGAGAAA GTGGTAACGA AAATAAGGGT AAATTGAGTT TTTTTCGGGG ATTTTTAATG 2 58 0 

AATTAATTTA ATTCGGATAT TTAATAAATA TATGGTTTTT AATGAGCGTG CGTGTGCGTG 2 64 0 

TATTTCGTAT TTTTAGTTGC GGGTGCGTTC GTTTGCGTTC GTCGTTTTTA GTTAGAGTTT 2700 

GTATTTGGTA GTTTCGAGTT CGAGCGGTAG TTTAGGACGT AGTCGAGGAG CGTCGTCGGT 27 60 

GCGTTTCGAT TAAAATGTGA ACGGGTTTGT TTTTTTTTTT CGTTGTATCG TGTTTTTGTC 2820 

GAGCGTAGTT AAGTGAATTT AGTGAAAGTA GGAGTTTTTT TGTTTAGTCG TAGTTAGGTA 2 88 0 

GTTTTCGCGT GATTTTAAGA TTAATATTAG ACGCGTAGAA TTTATGTAGG TTTTTGTTTA 2 94 0 

GTTTTTGTT 2949 

AN GAB EN ZU SEQ ID-NO: 29: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 117 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandel te Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 29: 

AG TAG TAG T A GTTTATTTTG GGTTGATATA AAATTGAAAA ATTTATTTGT TTTTTTATTT 60 
TTTTGGGTTG GATTCGGTGT ATCGGTTGAT ATATTTTTTT GGTTATTAGT TTTTGTT 117 

ANGABEN ZU SEQ ID-NO: 30: 

SEQUENZCHARAKTERI ST IKA : 
LANGE: 639 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelt e Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 30: 

AG TAG TAG T A GTATTATGGT TATTTCGACG GTCGCGTTCG TTATTTTTTT GCGGCGGTTT 60 

AGTCGCGACG TTGTTAGGGT TAGTAAATTT TTTTTATTTT TGGGCGTAAT GGTTGTCGGG 120 

GTCGGGGTTT TTCGCGGGTT AGGAGGCGGT GATTCGTTTT GGGTTTGGGT TTGTATTTTT 18 0 

TCGACGGTTG TTTTTCGTTT TTTTTATTTT GTTTTTGCGG GTTTTAGTCG CGGCGGTGTC 24 0 

GTTTTTTAAG TCGTTCGTTA AGGGGAGGTT TTTCGTGGGT TACGTTAGGG GTAGTTTTCG 300 

ACGGTTTAGA GTTAGTGGTT TTTTAGTATT TTTTCGTTTA GTTTTAACGA TTTTGGGTAT 3 60 

TTGAGATTCG CGGTTTTTCG GACGGTTGGT TTTTTAGGGA TTTGAGATGT TTGTTTTTTA 42 0 

GATTGTTGTT TTTTTAGGGA TGGCGCGGTG TTTGGGTTTT AGATTGTTTA GATAGATTAT 4 80 

TTTTTGATGG AGAGGGGATT GTTTTTCGCG TTTCGGACGT TTCGGGTTTT GAGTTGCGGG 54 0 

TGTTGTTTAT CGGGCGCGAT TTTTTAGTAG GTTTTGCGTT TTGTTTTTTG GTAAGTATCG 600 

ATTTATTTTG TTATTTTTGT CGCGGTTTTA GTTTTTGTT 639 

ANGABEN ZU SEQ ID-NO: 31: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 304 Basen 
ART: Nukleinsaure 
STRANGFORM : Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 
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SEQUENZBESCHREIBUNG: SEQ ID-NO: 31: 

AGTAGTAGTA GTATAGTTCG GCGTTGGTTA GCGGTTTAGA GTCGGGGTAG GGAGGGTTTT 60 

CGTGCGGACG GGGGTTAAGA GGTCGTTTTT AGTTCGGGGT AGTTCGCGTA TTCGAGTTTG 12 0 

GAGTTCGGAG TTTGGAGGGG TGGGGAGGTT TCGCGTTTAG GGTCGGATCG GAGGGAGAGG 18 0 

GAGAGCGGTG GTTTTTTTTT CGGTTTTCGT CGTTAGTCGA TCGGGGCGTT GGGCGGGCGT 24 0 

CGCGGGAGTC GTAGTTTTTT TCGGGGGGCG GATTCGGTTT CGGCGGCGGT ATTTAGTTTT 300 

TGTT 304 



